CVPR2025 | DFormerV2 | 几何自注意力

2643
0
2025-04-28 09:02:00
正在缓冲...
61
21
171
25
今天为大家介绍一篇CVPR2025论文《DFormerv2: Geometry Self-Attention for RGBD Semantic Segmentation》。这篇论文聚焦在RGB-D图像语义分割任务中,如何更高效地利用深度信息。传统方法通常采用双分支网络分别处理RGB和Depth,再进行特征融合,计算量大且效率低。而DFormerv2提出了一个全新视角 —— 把深度图当作几何先验(geometry prior),直接引导注意力分配,而不是再用深度图去提特征。核心技术是 Geometry Self-Attention(GSA),它结合了深度距离和空间距离生成几何先验,然后通过一个衰减函数整合到注意力机制中,使模型更关注几何上相关的区域。同时,作者还设计了轴向分解(decomposed attention),沿横向和纵向分别计算注意力,极大地降低了计算量。最终,构建了轻量级但性能强劲的RGBD骨干网络 DFormerv2,在NYU Depth V2 和 SUNRGBD 等多个语义分割数据集上都达到了 SOTA 性能,甚至在保持更少参数和更低计算成本的同时,超过了 GeminiFusion、CMX 等方法。总结来说,这是一次将几何信息显式引入Transformer注意力机制的成功尝试,为RGBD语义分割任务提供了一种高效、结构感知的解决方案。
感谢关注,本人分享: - 深度学习相关的知识 - 主要是cv领域的即插即用模块 - 0基础入门深度学习教程 - 深度学习写小论文的教程
自动连播
36.8万播放
简介
3D EfficientViT:EfficientViT的3D版本,适用于3D的模块
00:45
GAU(AAAI2024):无缝集成到SNN的即插即用注意力模块
00:26
PGM(NeurIPS2023):适用于图像去噪,去雨,去雾的即插即用模块
00:51
GAB&GHPA(MICCAI2023):可以缝在Unet中的即插即用模块,适用于2d图像分割
01:09
axial attention(MICCAI2021):适用于图像分割的注意力模块
01:39
SDM:适用于3D图像分割,即插即用
01:01
AFF(WACV2021):基于注意力机制的多特征融合模块
00:37
FFA(AAAI 2020):用于单图像去雾的特征融合注意力模块
01:22
MSCA(NeurIPS 2022):一种多尺度卷积注意力模块,适用于语义分割
01:33
Stand Alone Self Attention(NeurIPS2019):即插即用的自注意力机制模块
02:13
TVConv(CVPR):可用于医学图像分割以及人脸识别的布局感知视觉处理的高效平移变体卷积
02:49
dynamic conv(CVPR2020):包含一维,二维,三维的动态卷积,即插即用
00:52
SmoothNet(ECCV2022):适用于姿态估计领域的即插即用模块,可以跟任意的2D和3D姿态估计网络进行组合
00:43
DA模块,双重注意力,即插即用
00:57
SENet的3D版本和PE模块,即插即用3D注意力模块
00:36
GhostModuleV1&V2:可以代替原有的卷积操作,即插即用
00:55
PyConv:金字塔卷积,适用于几乎所有计算机视觉任务,即插即用
00:25
SPConv:无缝替换现有网络中的常规卷积,即插即用
00:39
ULSAM(WACV2020):一种空间注意力模块,即插即用
01:24
DFF:可以缝合在transformer中的动态特征融合模块,来自于2024年3月份的文章,适用于2D和3D分割任务
00:46
MDCR:多膨胀率通道卷积模块,即插即用,适用于目标检测等计算机视觉任务
00:34
DASI:一种特征融合模块,即插即用,适用于目标检测等计算机视觉领域
00:52
scSE:空间通道注意力,即插即用,适用于图像分割等图像处理领域
00:31
CondConv:经典动态卷积,适用于几乎所有计算机视觉图像任务
00:22
SDM:特征融合模块,即插即用,2D和3D均适用
00:43
DO-Conv:深度超参数化卷积层,适用于计算机视觉图像处理任务,可以替代传统卷积
00:41
CLEEGN:即插即用模块,适用于自动脑电图信号(EEG)重建,来自于24年2月份的论文
00:32
GRN:全局响应归一化,可替换transformer中的归一化层
01:03
DA_Block:即插即用模块,可缝合在transformer或unet中
00:51
NAF:即插即用模块,适用于图像恢复领域
00:25
MobileNetV4来啦,其中的UIB块
00:50
TIF:特征融合模块,可以在跳跃连接过程中使用
01:01
PConv(CVPR2023):即插即用卷积模块
01:03
GCT(CVPR2020):改进通道注意力SENet,即插即用模块
00:31
FECAM:频率增强通道注意力模块,适用于时间序列预测任务,可以缝合在transformer中,即插即用
00:50
超轻量且高效的动态上采样器,附演示教程,可以轻松替代现有的上采样器,即插即用
01:41
RSAblock:适用于3d医学图像分割的注意力模块,可以缝合在UNet中,即插即用
00:38
CPCA:改进SE和CBAM的即插即用注意力模块
00:46
SFFusion:特征融合模块,2d和3d版本,附创新点的启发,提取和融合浅层特征
01:10
RevIN(ICLR 2022):适用于时间序列预测任务的归一化方法,可以应用在transformer中
01:01
ICB和ASB(ICML 2024):适用于时间序列任务的即插即用模块,可以应用在transformer中
00:53
元素相乘优于相加,全新backbone:StarNet(CVPR2024)
00:59
GSC(MICCAI2024):可以应用在Mamba中的卷积模块,3d和2d版本,即插即用
00:55
TIAM:适用于遥感图像变化检测任务的时空交互注意力模块
00:44
频率感知跨模态注意力和加权跨模态特征融合,适用于RGBD显著性目标检测任务
01:25
EFF:高效特征融合模块,适用于图像分割任务,2d和3d版本
01:00
DSAM:适用于图像恢复任务的注意力模块
00:49
HAAM:混合自适应注意力模块,适用于图像分割任务
00:51
LPA:局部金字塔注意力模块,2d和3d版本,适用于图像分割任务
00:53
两个适用于图像去噪任务的残差注意力模块,即插即用
01:14
CSA:可以应用在U型网络中的跨尺度注意力模块
01:33
多尺度注意力融合模块MSAF,2d和3d版本
01:07
多尺度并行大核卷积模块和增强并行注意力模块,适用于图像去雾任务【深度学习】
01:01
结合了多尺度大核注意力和门空间注意力单元的注意力模块,适用于图像超分领域
00:49
PAA endocer,即插即用下采样模块,附替换教程,适用于图像分割任务
01:16
即插即用特征提取注意力模块HWAB,可用于低光图像增强任务
00:33
自适应分层特征融合模块HFF,适用于图像分类、图像分割任务,深度学习即插即用模块
01:11
(JSTARS 2024)变化边界感知模块CBM,适用于遥感图像变化检测任务
00:55
双时态特征聚合模块BFAM,可用于遥感变化检测领域任务
01:05
CMUNeXtBlock(ISBI 2024),大核卷积下采样模块
01:03
可用于3d医学图像分割的特征融合模块,24年6月份arxiv
00:46
多尺度图卷积模块,点云领域【深度学习即插即用模块】ECCV 2022
00:41
可以应用在YOLO中的即插即用注意力特征融合模块CPAM
00:37
深度学习可用于时间序列预测任务的可变形注意力模块Deformable Attention
00:37
【ICCV2023】深度学习多尺度线性注意力模块MLA
00:39
【ECCV 2024】深度学习图像超分领域的轻量级即插即用模块FMB
00:59
深度学习语音增强领域模块TSConformerBlock
01:09
(PRCV)深度学习即插即用空间聚合模块GLSA,医学图像分割
00:46
深度学习多尺度差异融合模块MDFM,遥感变化检测
00:52
Neural Networks 2024 | 深度学习改进SE通道注意力
00:50
深度学习 | (arXiv 2024.07)即插即用注意力SCSA
01:03
深度学习ECCV 2024 | mamba模块RSSG
01:04
ECCV 2024 | 即插即用小波变换卷积,计算机视觉任务通用
01:05
深度学习 | ICCV 2023 | 图像超分领域模块FMM
01:09
深度学习 | MICCAI 2024 | transformer模块ENLTB
01:02
深度学习 | 图像超分 | 高效长程注意力ELAB
01:02
深度学习 | ECCV 2024 | 图像恢复 | 直方图Transformer
01:41
深度学习 | ECCV 2024 | 语义分割 | RCM模块和DPG头
01:49
Transformer | Mamba | 线性注意力模块MLLA | 计算机视觉任务通用
01:11
深度学习 | ICCV 2023 | 轻量高效编码器 | 视觉任务通用 | 即插即用
01:21
深度学习 | 线性可变形卷积LDConv | 视觉任务通用 | Image and Vision Computing
01:48
深度学习 | ICME 2023 | 红外小目标检测 | Transformer模块和卷积模块
01:03
深度学习 | TGRS | 目标检测 | YOLO | 轻量级模块
01:09
【24年7月】SvANet | 小型医学对象分割网络
01:10
深度学习 | KAN+SCConv | SCKansformer
01:01
深度学习裂缝分割 | 基于Haar小波的注意力
01:09
CVPR 2024 | 医学图像分割 | 高效多尺度卷积注意力解码器EMCAD
01:41
CVPR 2024 | 图像恢复 | Adaptive Sparse Transformer
01:32
三维医学图像分割和重建 | DEFN
01:24
BMVC 2024 | 医学图像分割 | 多尺度自适应空间注意力门控MASAG
01:26
深度学习 | 时间序列预测 | AAAI 2024 | MSGNet
01:20
深度学习 | KBS | RGBD显著性目标检测 | MAGNet
01:26
深度学习 | 图像超分 | ICCV 2023 | DAT
01:38
仅使用pytorch实现的即插即用Mamba模块,不需要linux环境和mambassm库
00:51
深度学习遥感分割 | 基于小波的空间和频域融合网络SFFNet
01:03
深度学习轻量级图像恢复网络RAMiT,CVPR2024 Workshop
01:51
深度学习息肉分割 | WACV2024 | MEGANet
01:17
深度学习 | 遥感语义分割 | 多尺度聚合注意力模块MSAA
01:11
深度学习CVPR2024 | 用于语义分割的频率自适应扩张卷积
01:04
深度学习每日论文 | 医学图像分割 | 双重交叉注意力DCA
01:35
深度学习即插即用模块 | 2d,3d医学图像分割 | PMFS模块
01:28
CVPR 2024 | 遥感目标检测 | 即插即用PKI模块
01:33
深度学习 | 医学目标检测 | 基于YOLO的改进网络
01:54
深度学习 | ICLR 2024 | 即插即用模块 | 计算机视觉任务通用 | MogaNet
01:09
深度学习目标检测 | 多尺度特征融合 | 即插即用模块
00:52
深度学习CVPR 2024 | 轻量高效ViT | SHViT
01:13
深度学习CVPR 2024 | InceptionNeXt | 即插即用模块
01:02
深度学习NIPS 2022 | InceptionMixer | Attention和CNN结合
00:50
深度学习CVPR 2023 | 图像去模糊 | 基于频域的Transformer
01:05
【GitHub开源】深度学习即插即用模块合集
01:51
深度学习图像超分 | 基于ViT | LMLT
01:13
深度学习BIBM2024 | 医学图像分割 | SMAFormer
01:45
GSAFormer:用于高效线性时间序列建模的门控槽注意力
00:53
深度学习图像超分 | 分组残差自注意力 | GRFormer
01:07
深度学习行人重识别 | PDM
00:52
TPAMI 2024 | 有效涨点的特征融合模块FreqFusion,目标检测、图像分割等任务均适用
00:52
深度学习AAAI2024 | 图像恢复SOTA | OKNet
01:01
深度学习图像去雾 | 级联动态滤波器 | CasDyF-Net
01:23
轻量高效即插即用模块MSPA,二维视觉图像任务均可用
01:23
TGRS | 遥感变化检测 | ELGC-Net
01:10
【CVPR 2025】可替代传统归一化层的DyT,即插即用,附使用教程
02:41
CVPR 2025 | ARConv 自适应矩形卷积
01:36
CVPR2025 | DFormerV2 | 几何自注意力
01:29
【CVPR2025】即插即用动态卷积
01:21
CVPR2025 | 图像超分 | 轻量级网络CATANet
01:19
客服
顶部
赛事库 课堂 2021拜年纪