Nov, 2018

自主驾驶的深度强化学习

TL;DR本研究旨在利用深度确定性策略梯度算法来应对自主驾驶中复杂的状态和行动空间,我们选择 The Open Racing Car Simulator (TORCS) 来模拟实验环境,并选择适宜的传感器信息设计奖励机制并建立 DPPG 模型,实验结果表明模型在多种场景下均取得了良好的效果。