投稿

“像素级完美”深度感知，NeurIPS高分论文解密

1009

0

2025-12-12 12:15:00

未经作者授权，禁止转载

现有的单目深度模型普遍面临"飞点"(Flying Pixels)问题。判别式模型由于回归损失的平滑倾向,会在深度边缘处预测"折中"值,导致飞点;生成式模型亦会导致边缘飞点和结构失真。为此许刚伟博士团队提出了Pixel-Perfect Depth,直接在像素空间扩散生成,有效消除了由VAE压缩导致的飞点问题。最终,Pixel-Perfect Depth在所有生成式模型中取得了最好的表现。

自动驾驶之心发消息

自动驾驶之心官方唯一授权B站号。专注自动驾驶全栈技术与产业交流！

兄弟，你开什么国际玩笑竟然AI建模

3000+人感兴趣

端到端自动驾驶的脉络

07:26

知识驱动方法，解决数据驱动的瓶颈

08:06

神经-符号系统的演变

10:47

大一统端到端自动驾驶框架

04:21

以自车为中心，0.1秒极速重建场景

07:33

低成本自动生成对抗性驾驶场景

07:38

Diffusion Planner的几个核心点

08:09

做自动驾驶VLA缺数据？看看Impromptu-VLA

08:15

BeTopNet如何对多智能体进行行为预测？

11:17

基于路口交通流场景的合成数据技术应用

34:03

复旦BezierGS如何重建动态场景？

06:17

带你梳理近期动态重建的相关工作

06:15

为什么协同感知需要范式转移？

04:08

V2X和自动驾驶的未来发展会是什么样的？

08:58

自驾十年回顾，圆桌对话行业大佬！

10:36

回顾自驾十年，圆桌对话行业大佬（下）！

12:12

复盘过去两年自动驾驶领域的发展

09:51

复盘过去两年自动驾驶领域的发展（下）

17:37

世界模型 VS VLA：智驾路线之争背后，端到端已是基石？

21:24

研究收敛 + 落地内卷，自动驾驶新人怎么突围？

27:57

清华大学直播分享！扩散模型的联合规划模型为什么能问鼎nuPlan SOTA？

46:47

“像素级完美”深度感知，NeurIPS高分论文解密

34:48

从DriveVLA-W0出发：探讨世界模型如何放大VLA的扩展定律

16:10

清华&小米，免位姿前馈4D自动驾驶世界DGGT

24:31

Bench2Drive-Speed：速度可控的自动驾驶评测基准

33:31

复旦&引望最新! DynamicVGGT:面向自动驾驶的统一动态场景重建框架

43:53

顶部