Oct, 2018

灵活推理、规划和控制的深度仿真模型

TL;DR本文提出了模仿模型方法,将模仿学习和目标导向规划相结合,使用概率预测模型生成解释性的专家级轨迹,以实现特定目标。在动态模拟自主驾驶任务中,我们的方法显著优于六种模仿学习方法和一种基于规划的方法,并可以从专家演示中高效地学习。此外,我们的方法对于目标规范不良的情况具有鲁棒性。