Sep, 2019

利用深度强化学习进行动态和不确定高速公路环境下的自动车道变更决策

TL;DR研究开发了一个新型仿真环境,采用深度强化学习的方法训练代理人,在动态和不确定的交通环境中实现了一致的性能,并表明所提出的数据驱动方法在嘈杂的环境中表现显著优于完全依赖启发式的方法。