Jun, 2024

自助学习多模态预训练在 3D 目标检测中的应用

TL;DR通过使用与图像相关的 shelf-supervision 模型对配对的 RGB 和 LiDAR 数据进行无监督预训练,我们提出了一种能够生成零样本 3D 边界框的点云表示方法,这种方法在半监督检测中能够显著提高检测准确性,尤其适用于 LiDAR-only 和多模态 (RGB + LiDAR) 检测。我们在 nuScenes 和 WOD 上展示了我们方法的有效性,并在有限数据环境中明显改进了之前的工作。