Jul, 2024

探索未触及的扫描,用于冲突感知的 3D 分割预训练

TL;DR利用视觉基础模型,从未被开发的帧中精选 LiDAR 和图像配对,通过语义掩码标签设计交叉的跨模态冲突感知对比损失,提出了一种新颖的 LiDAR - 相机 3D 表示预训练方法,在三个主要自动驾驶公开数据集(nuScenes、SemanticKITTI 和 Waymo)的 3D 语义分割任务中相对于现有的最先进预训练框架提升了 3.0%〜3.3%的 mIoU。