Nov, 2023

弱监督和半监督的三维语义分割的二维特征蒸馏

TL;DR通过使用 RGB 图像提供场景的更密集表示,我们提出了一种基于图像引导网络(IGNet)的方法,该方法借鉴了通过域适应合成训练的 2D 语义分割网络中的高级特征信息,进一步利用了一种称为 FOVMix 的新型混合策略以解决两个传感器之间的水平视场不匹配问题,以增强图像引导效果,并在 ScribbleKITTI 上实现了弱监督 LiDAR 语义分割的最先进结果,与全监督训练相比,仅使用 8% 的标记点,无需额外的标注负担或推理中的计算 / 内存成本。此外,我们还展示了我们的方法在半监督训练中的有效性,IGNet 在 ScribbleKITTI 和 SemanticKITTI 上均取得了最先进的结果。