Apr, 2023

VoxelFormer:基于双视图注意力的鸟瞰特征生成,用于多视角 3D 物体检测

TL;DR本文研究了基于 Transformer 的目标检测器在多视角三维物体检测领域的局限性,并从鸟瞰图特征生成的角度提出了新的双视角注意力特征生成方法,将其应用于 BEVFormer 架构中,建立了一种新的检测器 VoxelFormer,实验结果表明其性能在 nuScenes 基准测试中显著优于 BEVFormer。