投稿

社区开放麦#18 | 半监督学习在 3D 目标检测的最新进展

1138

1

2022-08-19 18:55:39

未经作者授权，禁止转载

正在缓冲...

本次分享的内容包括：半监督学习：从 2D 到 3D；半监督学习在 3D 目标检测的进展。 OpenMMLab 公众号回复“社区开放麦”即可获得相关资料。

计算机视觉

半监督学习

OpenMMLab 发消息

社区开放麦#1｜基于关键点的动作识别

46:41

社区开放麦#2｜CVPR前沿姿态估计论文精讲

01:00:13

社区开放麦#3｜PyTorch 分布式训练解读

01:06:51

社区开放麦#4｜手把手带你复现最新自监督算法

01:01:09

社区开放麦#5｜带你探寻可见光之外的世界

36:01

社区开放麦#6｜带你了解车速估计技术在自动驾驶领域的应用

50:40

社区开放麦#7 | MMPose 姿态估计创意 demo 大赛

59:49

社区开放麦#8 | 迈向真实世界的感知：3D 目标检测

01:09:23

社区开放麦#9 | OpenMMLab 模块化设计背后的功臣

59:46

社区开放麦#10 | MMDeploy ncnn 部署实战

47:44

社区开放麦#11 | BEV感知：下一代自动驾驶感知算法新范式

57:01

社区开放麦#12 | 视觉有向目标的高精度监测

01:03:46

社区开放麦#13 | 手势识别算法综述与正确打开方式

57:48

社区开放麦#14 | 从时间序列角度破解姿态估计中的两大问题

01:34:16

社区开放麦#15| 突破纯视觉 3D 检测深度估计瓶颈

59:31

社区开放麦#16 | 稀疏卷积的高性能部署

58:07

社区开放麦#17 | 像素级别的多目标跟踪方案

32:41

社区开放麦#18 | 半监督学习在 3D 目标检测的最新进展

45:01

社区开放麦#19 | 对 AI 炼丹师友好的模型部署探索

01:24:31

社区开放麦#20 | 简单有效的目标跟踪方案

50:46

社区开放麦#21 | 当钩子编程遇到深度学习：Runner & Hook

59:58

社区开放麦#22 | 姿态估计领域的前沿进展

01:17:13

社区开放麦#23 | MMYOLO 圆桌会

51:38

社区开放麦#24 | 释放数据潜力，打造 AI 加速引擎

53:51

AI奇妙夜第一期

01:16:09

社区开放麦#27 | 部署神器Halide, 实现高性能算法

46:06

AI 奇妙夜#2 | 子豪兄分享人工智能学习心法

01:22:07

社区开放麦#29 | ECCV Oral | 用于场景文本检测识别的弱监督视觉语言预训练方法

53:31

社区开放麦#30 | 入门剪枝利器 MMRazor，迈出模型压缩第一步

53:24

社区开放麦#31 | 异构检测器间知识蒸馏算法 PKD | NeurIPS22

55:56

社区开放麦#32 | ONNX 新特性和最佳实践介绍

01:06:28

社区开放麦#33 | 详解 ACCV22 大规模细粒度图像分类夺冠方案

36:03

社区开放麦#34 | 突破 AI 推理性能瓶颈，神经网络量化的方法与实践

01:04:09

AI 奇妙夜#3 | 大规模多模态预训练最新研究进展

53:10

社区开放麦#36 多模态场景下的高性能 Embedding 计算服务

52:10

社区开放麦#35 | 牛津大学vgg组博士：提高遮挡检测下的目标检测效果

55:18

社区开放麦#38 目标检测新范式！DETR 系列算法解读

02:03:27

弱监督有向目标检测 | 杨学

01:04:14

社区开放麦#41 | 视觉大模型设计新范式

01:06:15

AI 奇妙夜#4 | 文字识别：从数据趋动到模型自监督

01:06:35

社区开放麦#42 | 面向自动驾驶场景的纯视觉三维语义占有预测

01:10:13

社区开放麦#43 | 高精度实例分割 PatchDCT

22:03

AI奇妙夜#5 | “视觉与语言”跨模态智能及应用

01:00:59

CVPR 2023 有向目标检测角度预测新方法 — 相移编码 | 社区开放麦#45

41:41

业界可用的高性能的姿态估计模型能有多快？ | 社区开放麦#46

01:27:37

CVPR2023 首个大规模全场景人体数据集 Human-Art | 社区开放麦#47

59:00

MOSS：如何打造对话式语言模型 | 社区开放麦#48

01:05:19

超大规模视觉通用感知模型-代季峰教授 | AI奇妙夜#6

50:12

视频理解基础模型及下游应用-王利民教授 | AI奇妙夜#7

01:00:43

ICLR Spotlight | 在卷积网络上做BERT式预训练

56:44

HumanBench：迈向以人为中心的通才模型

45:54

低成本微调垂直领域专属 ChatGPT

01:07:12

自动驾驶场景中的半监督点云分割

01:03:23

基于 Visual Transformer 的分割模型综述

01:02:06

AI 2.0：突破性技术推动智能制造的应用创新

55:11

基于 SAM 大模型的实例分割研究 —— RSPrompter

52:55

开放检测视觉场景理解 | 社区开放麦

01:07:01

运用 SAM 模型分割任意点云

01:16:19

MMBench：基于ChatGPT的全方位多模能力评测体系

42:30

迈向更强的端到端多人姿态估计

01:05:30

SAM 时代，图像/视频分割将何去何从？

01:07:34

MFF：简单高效的多级特征融合自监督方法 | ICCV 2023

39:03

更好的人体姿态，更好的生成图像

33:05

基于大规模多模态扩散模型的文本到视频生成

01:10:46

多模态任务终结者：Meta-Transformer

59:30

迈向更强的开集目标检测-From Detection to Grounding

57:19

如何基于大模型构建智能体？多机构百页综述从交互角度详解 AI Agent！

01:10:51

你的3D感知模型够鲁棒吗？Robo3D告诉你答案！

01:09:08

如何高效微调大模型？技术原理与最佳实践揭秘！

01:26:20

大模型时代通用检测趋势解读及MMDetection未来展望

01:22:24

CVPR23 | 3D Occupancy 预测冠军方案：FB-OCC

52:45

多模态 Agents：用大模型语言模型串联多模态专家

39:48

探索未知：LLM Agent 应用开发的全新时代

01:07:39

AI时代数据应用的全链路工厂- Chat2DB

35:53

语音与音频生成 Amphion揭秘霉霉如何演唱《稻香》

59:55

RTMPose 家族史诗级更新！多人、全身一网打尽

01:20:21

清华提出首个面向无监督和半监督新意图发现的文本聚类框架USNID

01:09:12

Beyond Segmentation Anything，超越SAM

01:08:50

Sora 夜谈之 Video Diffusion 综述

01:30:09

新一代换脸神器 InstantID：高保真人像秒级生成

01:16:56

具身智能中的多模态三维感知思考

51:26

PK 周杰伦，全能音乐创作大模型 SongComposer 作词作曲令人惊叹

01:06:09

Stable Diffusion 3 论文技术解析，架构细节大揭秘！

58:15

无需训练的 Stable Diffusion 视频编辑方法

56:49

Latte 专场: 深度解读视频生成与训练技术

02:00:08

微软研究院谭旭带来零样本 TTS 模型 NaturalSpeech 3

01:02:41

零样本语音生成大模型与Amphion实践

01:07:19

多模态大模型的技术实践与思考

01:05:53

当大模型遇上心理咨询：基于心理咨询报告的对话重构和评测框架CPsyCoun

54:02

ACL 24 论文分享（东北大学信息检索小组场）

01:13:27

SD-Eval新基准，让语音交互大模型情智兼备

47:56

直播回放-08月08日

01:10:26

开源工具MinerU助力复杂PDF高效解析提取

01:07:06

MindSearch：AI 时代的“思考型”智能搜索引擎

58:35

MaskGCT：基于掩码生成模型的大规模零样本 TTS 模型

01:22:28

顶部