Mar, 2024

LVIC: 提取视觉信息作为线索的多模态分割

TL;DR多模态融合在自动驾驶的三维感知中被证明是一种有效的方法。然而,目前大多数用于 LiDAR 语义分割的多模态融合方法具有复杂的融合机制。点绘制是一种直接将 LiDAR 点与视觉信息绑定的简单方法,但是之前的点绘制类方法存在相机和 LiDAR 之间的投影误差问题。为了解决这个问题,我们提出了一种基于深度的点绘制机制,显著提高了多模态融合效果。此外,我们对 LiDAR 进行了更深入的研究,以确定其所需的视觉特征,通过提取视觉信息作为线索,我们在 nuScenes 的 LiDAR 语义分割基准测试中排名第一。我们的实验证明了该方法的鲁棒性和有效性。代码将很快公开。