Jul, 2018

基于视觉的可控模仿强化学习在自动驾驶中的应用

TL;DR本文提出基于CIRL 和 DDPG 的深度强化学习方法能够在高保真车辆模拟器中,仅基于视觉输入实现驾驶任务,并相较于监督式模仿学习表现更优,特别地,文章为多控制信号专门设计自适应策略和奖励方案,并基于编码技术引导驾驶代理人在一定限制空间内探索,相较以往方法在CARLA数据集实验中显著提高了成功率。