Sep, 2023

交通优化中的隐式感知:先进的深度强化学习技术

TL;DR通过采用深度强化学习从事自主驾驶车辆上的车辆跟随和变道模型,本论文探讨了解决构成道路阻塞的突发情况,提出了基于 Markov 决策过程和 MEC 辅助架构的综合决策控制系统,并通过 SUMO 模拟器和 OPENAI GYM 评估了该模型的性能,结果显示使用 ε-greedy 策略进行训练的 DQN 代理明显优于使用 Boltzmann 策略进行训练的代理。