Apr, 2021

弱合作多智能体交通控制问题的独立强化学习

TL;DR本研究使用独立强化学习解决复杂的交通协同控制问题,提出了一种部分可观测弱协同交通模型来优化一组路口的整体交通状况,并提出了 Cooperative Important Lenient Double DQN(CIL-DDQN)算法来应对其他智能体策略变化引起的经验失效问题,且该算法在交通控制问题的几乎所有性能指标方面优于其他方法。