Jan, 2019

具备深度强化学习的类人自动驾驶车辆跟随模型

TL;DR该研究提出了一种基于深度强化学习的类人自动车跟随规划框架,并通过创新的奖励函数和反应延迟考虑等方法,将人的驾驶行为映射到速度、相对速度和车辆间距离等状态空间,实现了精度更高的自动驾驶策略学习,具有较强泛化能力,可以为智能驾驶算法和交通流模型的发展提供帮助。