CVPROct, 2022

桥接变压器用于视觉和点云 3D 物体检测

TL;DR使用 Bridged Transformer 对 3D 与 2D 目标物体区域进行端到端的学习,特别利用对象查询作为 3D 和 2D 空间的桥梁,实现多模式融合,可有效实现从点云和图像中识别物体的边界框,进而提高多视角成像中的物体检测效率。在 SUN RGB-D 和 ScanNetV2 数据集上,Bridged Transformer 优于现有方法。