Jun, 2024

使用 RGB-D 融合在 DiffusionDet 框架中增强的汽车物体检测

TL;DR一项基于视觉的自动驾驶需要可靠高效的对象检测的研究提出了一种 DiffusionDet 框架,该框架利用单目相机和深度传感器的数据融合来提供 RGB 和深度(RGB-D)数据,并通过在训练阶段随机重塑基准边界框,使模型学习噪声加入的相反扩散过程。通过将 RGB 图像的纹理和颜色特征与 LiDAR 传感器的空间深度信息结合起来,所提出的框架采用了特征融合,从而大大提高了汽车目标的对象检测能力。在 KITTI 数据集上进行的全面实验取得了 2.3 的 AP 增益,特别是在检测小物体方面展示了所提出方法的改进性能。