Jul, 2018

一日学车

TL;DR本研究首次将深度强化学习应用于自动驾驶,通过模型自主探索学习一个仅需单目图像为输入的车道跟踪策略,并采用单一、易于获取的奖励措施:在无安全司机控制下行驶的距离。我们使用连续的、无模型的深度强化学习算法,并在车上执行所有探索和优化过程,为自动驾驶开发了一个新的框架,摆脱了对定义逻辑规则、制图和直接监督的依赖,同时也探讨该方法面对更广泛自动驾驶任务时的挑战和机会。