Mar, 2018

使用深度强化学习进行自动速度和车道变更决策

TL;DR该论文介绍了一种基于深度强化学习的方法,用于自动生成通用决策功能。通过在模拟环境中训练深度 Q 网络代理以处理卡车挂车组合的速度和车道变换决策,并在公路驾驶案例中表明该方法产生的代理匹配或超过了常用的参考模型。为了展示该方法的普适性,通过在对向交通的道路上训练它来训练同样的算法以进行超车案例的测试。此外,还介绍了一种将卷积神经网络应用于表示可互换对象的高级输入的新方法。