Feb, 2024

EMIFF: 增强的多尺度图像特征融合在车辆基础设施合作式三维物体检测中的应用

TL;DR我们提出了一种基于相机的三维检测框架,名为 Enhanced Multi-scale Image Feature Fusion (EMIFF),用于车辆和基础设施之间的协作感知任务。通过引入 Multi-scale Cross Attention (MCA) 和 Camera-aware Channel Masking (CCM) 模块,我们能够在尺度、空间和通道级别上增强基础设施和车辆特征,以修正由于相机不同步引入的姿态误差。同时,我们引入了 Feature Compression (FC) 模块,通过通道和空间压缩块提高传输效率。实验表明,EMIFF 在 DAIR-V2X-C 数据集上取得了 state-of-the-art 结果,显著优于以往的早期融合和晚期融合方法,在可比较的传输成本下取得了优异的性能。