“像素级完美”深度感知,NeurIPS高分论文解密

1009
0
2025-12-12 12:15:00
15
6
40
5
现有的单目深度模型普遍面临"飞点"(Flying Pixels)问题。判别式模型由于回归损失的平滑倾向,会在深度边缘处预测"折中"值,导致飞点;生成式模型亦会导致边缘飞点和结构失真。为此许刚伟博士团队提出了Pixel-Perfect Depth,直接在像素空间扩散生成,有效消除了由VAE压缩导致的飞点问题。最终,Pixel-Perfect Depth在所有生成式模型中取得了最好的表现。
自动驾驶之心官方唯一授权B站号。专注自动驾驶全栈技术与产业交流!
精彩直播回顾
(22/26)
4.9万播放
简介
端到端自动驾驶的脉络
07:26
知识驱动方法,解决数据驱动的瓶颈
08:06
神经-符号系统的演变
10:47
大一统端到端自动驾驶框架
04:21
以自车为中心,0.1秒极速重建场景
07:33
低成本自动生成对抗性驾驶场景
07:38
Diffusion Planner的几个核心点
08:09
做自动驾驶VLA缺数据?看看Impromptu-VLA
08:15
BeTopNet如何对多智能体进行行为预测?
11:17
基于路口交通流场景的合成数据技术应用
34:03
复旦BezierGS如何重建动态场景?
06:17
带你梳理近期动态重建的相关工作
06:15
为什么协同感知需要范式转移?
04:08
V2X和自动驾驶的未来发展会是什么样的?
08:58
自驾十年回顾,圆桌对话行业大佬!
10:36
回顾自驾十年,圆桌对话行业大佬(下)!
12:12
复盘过去两年自动驾驶领域的发展
09:51
复盘过去两年自动驾驶领域的发展(下)
17:37
世界模型 VS VLA:智驾路线之争背后,端到端已是基石?
21:24
研究收敛 + 落地内卷,自动驾驶新人怎么突围?
27:57
清华大学直播分享!扩散模型的联合规划模型为什么能问鼎nuPlan SOTA?
46:47
“像素级完美”深度感知,NeurIPS高分论文解密
34:48
从DriveVLA-W0出发:探讨世界模型如何放大VLA的扩展定律
16:10
清华&小米,免位姿前馈4D自动驾驶世界DGGT
24:31
Bench2Drive-Speed:速度可控的自动驾驶评测基准
33:31
复旦&引望最新! DynamicVGGT:面向自动驾驶的统一动态场景重建框架
43:53
客服
顶部
赛事库 课堂 2021拜年纪