Jan, 2024
MsSVT++: 混合尺度稀疏体素变换与中心投票用于3D物体检测
MsSVT++: Mixed-scale Sparse Voxel Transformer with Center Voting for 3D
Object Detection
TL;DR3D 目标检测中的突出问题是大规模室外场景下对象尺度的变化,需要同时获取远距离和细粒度信息的特征。为了解决这一问题,我们提出了MsSVT++,一种创新的混合尺度稀疏体素变换器,通过分治方法同时捕捉两类信息。使用棋盘采样策略和哈希映射在3D体素空间中进行稀疏的体素采样和聚集操作,以减轻基于窗口的变换器的计算复杂性。同时,引入了中心投票模块,将混合尺度上下文信息丰富的新体素朝着对象中心进行集成,从而提高了精确的对象定位。广泛的实验证明,我们的单阶段检测器在MsSVT++的基础上,对不同的数据集始终表现出优异的性能。