Apr, 2024

基于基础模型的弱监督激光雷达语义分割

TL;DR本文提出了使用散点图对图像进行注释,然后利用 SAM(一种基本模型)为图像生成语义分割标签。通过使用相机和 LiDAR 的内在和外在参数将图像的分割标签映射到 LiDAR 空间,我们获得了点云语义分割的标签,并发布了 Scatter-KITTI 和 Scatter-nuScenes,这是第一个利用基于图像分割的 SAM 进行弱监督点云语义分割的作品。此外,为了减小稀疏注释获取的错误伪标签对点云特征的影响,我们提出了一种用于 LiDAR 语义分割的多模态弱监督网络,称为 MM-ScatterNet。该网络通过引入多模态特征和点云特征之间的一致性约束,增强了点云的表示学习。在 SemanticKITTI 数据集上,我们仅使用 0.02%的注释数据就实现了 66%的全监督性能,在 NuScenes 数据集上,仅使用 0.1%的标记点就实现了 95%的全监督性能。