May, 2020

自主驾驶的层次行为和运动规划学习

TL;DR通过引入分层行为和运动规划(HBMP),我们在学习驾驶解决方案中显式地建模行为,解决了不同场景的 RL 训练效率低下的问题,并在 SUMO 的快速事件仿真器中进行训练,最终在 CARLA 动力学仿真器中进行训练并转移到现实世界,证明了该方法的有效性和可推广性。