Dec, 2023

视觉点云预测能够实现可扩展自动驾驶

TL;DR由于视觉自主驾驶应用需要同时处理语义、3D 几何和时间信息以进行联合感知、预测和规划,因此我们提出了一种名为 “ViDAR” 的预训练模型,用于预训练下游视觉编码器,并通过新颖的隐变换操作将历史嵌入式表示转换为 3D 几何空间,以实现未来点云的预测。实验结果表明,在下游任务中取得了显著的增益,如在 3D 检测上的 NDS 提高了 3.1%,运动预测的错误率减少了约 10%,规划中碰撞率减少了约 15%。