Nov, 2021

通用强化模仿及其在基于视觉的自动驾驶中的应用

TL;DR本研究提出了一种名为 GRI 的新方法,将探索和专家数据的优点相结合,简单易实现。通过提出离线演示智能体的概念,将专家数据与在线探索智能体的经验同时处理,证明了该方法在基于视觉的城市道路场景下的自主驾驶和 Mujoco 连续控制任务上的有效性,并在 CARLA Leaderboard 上取得了第一名。