Oct, 2023

UniPAD: 自动驾驶的通用预训练范式

TL;DR在自动驾驶领域,有效特征学习的重要性被广泛认可。本文介绍了 UniPAD,一种应用 3D 体积可微分渲染的新型自监督学习范式。UniPAD 隐含地编码了 3D 空间,便于连续 3D 形状结构的重建和其 2D 投影的复杂外观特征。我们的方法的灵活性使其可以无缝集成到 2D 和 3D 框架中,实现对场景的更全面理解。我们通过在各种下游 3D 任务上进行广泛的实验,证明了 UniPAD 的可行性和有效性。我们的方法分别在激光雷达、摄像头和激光雷达 - 摄像头基线上提升了 9.1、7.7 和 6.9 NDS。值得注意的是,我们的预训练流程在 nuScenes 验证集上实现了 73.2 NDS 的 3D 物体检测和 79.4 mIoU 的 3D 语义分割,与以前的方法相比取得了最先进的结果。代码将在此 https URL 上提供。