Feb, 2024

Cohere3D:利用时间一致性进行无监督视觉自动驾驶的表示学习

TL;DR为了克服图像中缺乏深度线索的问题,本文提出了一种新的对比学习算法 Cohere3D,用于在长期输入序列中学习一致的实例表示,从而在自动驾驶的下游任务中实现多个输入帧的实例级对应。通过预训练阶段中从 LiDAR 传感器中的原始点云构建长期时序对应来辅助从基于视觉的鸟瞰特征图中提取实例级表示。实验证明该算法在数据效率和任务性能方面都取得显著改进。