ECCVJun, 2023

重新思考自主驾驶的闭环训练

TL;DR本文针对自动驾驶代理的封闭式训练提出了一种新方法 —— 轨迹价值学习 (TRAVL)。采取多步预测进行规划,同时利用虚拟数据进行有效学习。实验证明,TRAVL 相比于其他模型,能够更快地学习并产生更安全的机动操作。