社区开放麦#18 | 半监督学习在 3D 目标检测的最新进展

1138
1
2022-08-19 18:55:39
正在缓冲...
23
9
55
14
本次分享的内容包括:半监督学习:从 2D 到 3D;半监督学习在 3D 目标检测的进展。 OpenMMLab 公众号回复“社区开放麦”即可获得相关资料。
自动连播
37.6万播放
简介
社区开放麦#1|基于关键点的动作识别
46:41
社区开放麦#2|CVPR前沿姿态估计论文精讲
01:00:13
社区开放麦#3|PyTorch 分布式训练解读
01:06:51
社区开放麦#4|手把手带你复现最新自监督算法
01:01:09
社区开放麦#5|带你探寻可见光之外的世界
36:01
社区开放麦#6|带你了解车速估计技术在自动驾驶领域的应用
50:40
社区开放麦#7 | MMPose 姿态估计创意 demo 大赛
59:49
社区开放麦#8 | 迈向真实世界的感知:3D 目标检测
01:09:23
社区开放麦#9 | OpenMMLab 模块化设计背后的功臣
59:46
社区开放麦#10 | MMDeploy ncnn 部署实战
47:44
社区开放麦#11 | BEV感知:下一代自动驾驶感知算法新范式
57:01
社区开放麦#12 | 视觉有向目标的高精度监测
01:03:46
社区开放麦#13 | 手势识别算法综述与正确打开方式
57:48
社区开放麦#14 | 从时间序列角度破解姿态估计中的两大问题
01:34:16
社区开放麦#15| 突破纯视觉 3D 检测深度估计瓶颈
59:31
社区开放麦#16 | 稀疏卷积的高性能部署
58:07
社区开放麦#17 | 像素级别的多目标跟踪方案
32:41
社区开放麦#18 | 半监督学习在 3D 目标检测的最新进展
45:01
社区开放麦#19 | 对 AI 炼丹师友好的模型部署探索
01:24:31
社区开放麦#20 | 简单有效的目标跟踪方案
50:46
社区开放麦#21 | 当钩子编程遇到深度学习:Runner & Hook
59:58
社区开放麦#22 | 姿态估计领域的前沿进展
01:17:13
社区开放麦#23 | MMYOLO 圆桌会
51:38
社区开放麦#24 | 释放数据潜力,打造 AI 加速引擎
53:51
AI奇妙夜第一期
01:16:09
社区开放麦#27 | 部署神器Halide, 实现高性能算法
46:06
AI 奇妙夜#2 | 子豪兄分享人工智能学习心法
01:22:07
社区开放麦#29 | ECCV Oral | 用于场景文本检测识别的弱监督视觉语言预训练方法
53:31
社区开放麦#30 | 入门剪枝利器 MMRazor,迈出模型压缩第一步
53:24
社区开放麦#31 | 异构检测器间知识蒸馏算法 PKD | NeurIPS22
55:56
社区开放麦#32 | ONNX 新特性和最佳实践介绍
01:06:28
社区开放麦#33 | 详解 ACCV22 大规模细粒度图像分类夺冠方案
36:03
社区开放麦#34 | 突破 AI 推理性能瓶颈,神经网络量化的方法与实践
01:04:09
AI 奇妙夜#3 | 大规模多模态预训练最新研究进展
53:10
社区开放麦#36 多模态场景下的高性能 Embedding 计算服务
52:10
社区开放麦#35 | 牛津大学vgg组博士:提高遮挡检测下的目标检测效果
55:18
社区开放麦#38 目标检测新范式!DETR 系列算法解读
02:03:27
弱监督有向目标检测 | 杨学
01:04:14
社区开放麦#41 | 视觉大模型设计新范式
01:06:15
AI 奇妙夜#4 | 文字识别:从数据趋动到模型自监督
01:06:35
社区开放麦#42 | 面向自动驾驶场景的纯视觉三维语义占有预测
01:10:13
社区开放麦#43 | 高精度实例分割 PatchDCT
22:03
AI奇妙夜#5 | “视觉与语言”跨模态智能及应用
01:00:59
CVPR 2023 有向目标检测角度预测新方法 — 相移编码 | 社区开放麦#45
41:41
业界可用的高性能的姿态估计模型能有多快? | 社区开放麦#46
01:27:37
CVPR2023 首个大规模全场景人体数据集 Human-Art | 社区开放麦#47
59:00
MOSS:如何打造对话式语言模型 | 社区开放麦#48
01:05:19
超大规模视觉通用感知模型-代季峰教授 | AI奇妙夜#6
50:12
视频理解基础模型及下游应用-王利民教授 | AI奇妙夜#7
01:00:43
ICLR Spotlight | 在卷积网络上做BERT式预训练
56:44
HumanBench:迈向以人为中心的通才模型
45:54
低成本微调垂直领域专属 ChatGPT
01:07:12
自动驾驶场景中的半监督点云分割
01:03:23
基于 Visual Transformer 的分割模型综述
01:02:06
AI 2.0:突破性技术推动智能制造的应用创新
55:11
基于 SAM 大模型的实例分割研究 —— RSPrompter
52:55
开放检测视觉场景理解 | 社区开放麦
01:07:01
运用 SAM 模型分割任意点云
01:16:19
MMBench:基于ChatGPT的全方位多模能力评测体系
42:30
迈向更强的端到端多人姿态估计
01:05:30
SAM 时代,图像/视频分割将何去何从?
01:07:34
MFF:简单高效的多级特征融合自监督方法 | ICCV 2023
39:03
更好的人体姿态,更好的生成图像
33:05
基于大规模多模态扩散模型的文本到视频生成
01:10:46
多模态任务终结者:Meta-Transformer
59:30
迈向更强的开集目标检测-From Detection to Grounding
57:19
如何基于大模型构建智能体?多机构百页综述从交互角度详解 AI Agent!
01:10:51
你的3D感知模型够鲁棒吗?Robo3D告诉你答案!
01:09:08
如何高效微调大模型?技术原理与最佳实践揭秘!
01:26:20
大模型时代通用检测趋势解读及MMDetection未来展望
01:22:24
CVPR23 | 3D Occupancy 预测冠军方案:FB-OCC
52:45
多模态 Agents:用大模型语言模型串联多模态专家
39:48
探索未知:LLM Agent 应用开发的全新时代
01:07:39
AI时代数据应用的全链路工厂- Chat2DB
35:53
语音与音频生成 Amphion揭秘霉霉如何演唱《稻香》
59:55
RTMPose 家族史诗级更新!多人、全身一网打尽
01:20:21
清华提出首个面向无监督和半监督新意图发现的文本聚类框架USNID
01:09:12
Beyond Segmentation Anything,超越SAM
01:08:50
Sora 夜谈之 Video Diffusion 综述
01:30:09
新一代换脸神器 InstantID:高保真人像秒级生成
01:16:56
具身智能中的多模态三维感知思考
51:26
PK 周杰伦,全能音乐创作大模型 SongComposer 作词作曲令人惊叹
01:06:09
Stable Diffusion 3 论文技术解析,架构细节大揭秘!
58:15
无需训练的 Stable Diffusion 视频编辑方法
56:49
Latte 专场: 深度解读视频生成与训练技术
02:00:08
微软研究院谭旭带来零样本 TTS 模型 NaturalSpeech 3
01:02:41
零样本语音生成大模型与Amphion实践
01:07:19
多模态大模型的技术实践与思考
01:05:53
当大模型遇上心理咨询:基于心理咨询报告的对话重构和评测框架CPsyCoun
54:02
ACL 24 论文分享(东北大学信息检索小组场)
01:13:27
SD-Eval新基准,让语音交互大模型情智兼备
47:56
直播回放-08月08日
01:10:26
开源工具MinerU助力复杂PDF高效解析提取
01:07:06
MindSearch:AI 时代的“思考型”智能搜索引擎
58:35
MaskGCT:基于掩码生成模型的大规模零样本 TTS 模型
01:22:28
客服
顶部
赛事库 课堂 2021拜年纪