ECCVJul, 2024

4D 对比超流是稠密的 3D 表示学习器

TL;DR在自动驾驶领域,准确的 3D 感知是其基础。为了解决依赖于昂贵且劳动密集的人工标注的问题,我们引入了 SuperFlow,这是一个新颖的框架,利用连续的 LiDAR 相机对建立时空预训练目标。SuperFlow 通过整合两个关键设计来脱颖而出:1)稠密到稀疏的一致性正则化,在特征学习过程中促进对点云密度变化的鲁棒性;2)基于流的对比学习模块,精心设计以从可用的传感器校准信息中提取有意义的时态线索。为了进一步提升学习效率,我们还增加了一个即插即拔的视图一致性模块,增强了从相机视角蒸馏出的知识的对齐。对 11 个不同的 LiDAR 数据集进行了广泛的比较和消融研究,验证了我们的有效性和优越性。此外,通过扩展 2D 和 3D 主干网络的预训练,我们观察到了一些有趣的新性质,为基于 LiDAR 的感知的未来研究提供了启示。