Jul, 2024

探索未触及的扫描,用于冲突感知的3D分割预训练

TL;DR利用视觉基础模型,从未被开发的帧中精选LiDAR和图像配对,通过语义掩码标签设计交叉的跨模态冲突感知对比损失,提出了一种新颖的LiDAR-相机3D表示预训练方法,在三个主要自动驾驶公开数据集(nuScenes、SemanticKITTI和Waymo)的3D语义分割任务中相对于现有的最先进预训练框架提升了3.0%〜3.3%的mIoU。