Sep, 2023

DFormer:重新思考语义分割的 RGBD 表示学习

TL;DRDFormer 是一种创新的 RGB-D 预训练框架,通过使用一系列 RGB-D 块进行编码,将 RGB 和深度信息编码成可转移的表示,并避免了现有方法中 RGB 预训练的主干网络对深度图中的三维几何关系进行不匹配的编码问题。在两个常见的 RGB-D 任务上,使用轻量级的解码器头微调预训练的 DFormer,该方法在两个 RGB-D 分割数据集和五个 RGB-D 显着性数据集上以不到当前最佳方法计算成本一半的代价实现了最新的最佳性能。