Jun, 2024

从失误中学习:自动驾驶车辆规划中缓解分布偏移的弱监督方法

TL;DR应对协变量转移现象的挑战,我们提出了 Learn from Mistakes (LfM) 作为解决方案。通过在各种场景中部署预训练的规划器,LfM 标记离开其即时目标的情况作为错误,并将这些错误对应的环境分类为闭环错误数据集。为了利用闭环错误进行学习,我们引入了弱监督方法 Validity Learning 来确定当前环境背景中的有效轨迹,实验结果表明该方法显著提高了封闭环路指标,如进展和碰撞率。