弱合作多智能体交通控制问题的独立强化学习

Apr, 2021

弱合作多智能体交通控制问题的独立强化学习

Independent Reinforcement Learning for Weakly Cooperative Multiagent Traffic Control Problem

Chengwei Zhang, Shan Jin, Wanli Xue, Xiaofei Xie, Shengyong Chen...

TL;DR本研究使用独立强化学习解决复杂的交通协同控制问题，提出了一种部分可观测弱协同交通模型来优化一组路口的整体交通状况，并提出了 Cooperative Important Lenient Double DQN（CIL-DDQN）算法来应对其他智能体策略变化引起的经验失效问题，且该算法在交通控制问题的几乎所有性能指标方面优于其他方法。

Abstract

The adaptive traffic signal control (ATSC) problem can be modeled as a multiagent cooperative game among urban intersections, where intersections cooperate to optimize their common goal. Recently, →

adaptive traffic signal control reinforcement learning cooperative game partially observable traffic control

发现论文，激发创造

多智能体深度强化学习用于大规模交通信号控制

本文提出了一种可完全扩展和去中心化的多智能体 A2C 算法，以提高城市交通网络中的自适应交通信号控制的可观测性和减少学习难度，并在大型合成交通网格和摩纳哥城的大型实际交通网络下，通过模拟高峰流量动态，并将其与独立 A2C 和独立 Q-learning 算法进行比较，结果表明其优化性、鲁棒性和样本效率优于其他最先进的去中心化 MARL 算法。

Mar, 2019

交通信号控制的协作强化学习

该论文提出了一种协作多目标多智能体深度再强化学习算法（COMMA-DDPG），用于交通信号控制的全局优化和减少延迟等待时间。该算法在真实的亚洲交通数据集上进行了评估，相比目前最先进的方法，成功地减少了 60％的延迟时间。

May, 2022

交通信号控制的多智能体深度强化学习新方法

随着旅游需求的增加和城市交通状况的复杂化，采用多智能体深度强化学习 (MARL) 来控制交通信号成为热门话题。本文提出了一种基于智能体合作方案的 Friend-Deep Q-network (Friend-DQN) 方法，以用于城市网络中的多个交通信号控制，该方法可以减少状态 - 操作空间，从而加快收敛速度。通过使用 SUMO (城市交通仿真) 平台评估友好 DQN 模型的表现，并展示其相对于其他现有方法的可行性和优越性。

Jun, 2023

城市交叉口智能交通信号控制的强化学习方法

本文基于强化学习方法提出一种针对城市交叉口交通信号控制的新模型，采用神经网络作为 Q 函数的近似器进行复杂的信号控制，使用开放源代码的交通模拟器 SUMO 进行实验，结果表明该模型能够显著降低排队长度和等待时间，与基准方法相比具有更好的收敛性和泛化性能。

May, 2019

交通信号控制的随机集成强化学习

该研究提出一种名为 RElight 的动态学习交通信号控制策略的模型，并结合随机集成学习方法以避免陷入局部最优结果。研究还引入了 UTD 比率以控制数据重用数量，以提高数据利用率并在合成数据和实际数据上进行了实验以证明该方法优于现有最优方法。

Mar, 2022

智能交通系统中的交通灯深度强化学习控制

本篇论文通过研究深度强化学习在交通灯控制问题中的应用，证明在格网路网中智能行驶的 “绿波” 策略自然而然地出现，并且优于传统方法，这为提高交通效率提供了途径。

Feb, 2023

智能交通灯控制的多智能体强化学习

本文提出了一种基于多智能体广义深度强化学习框架（MABRL）的智能交通信号控制系统，使用了广泛学习系统和动态自循环交互机制，通过与其他六种算法的比较，证明了其在解决交通拥堵问题上的有效性。

Mar, 2022

多智能体图强化学习中的学习分散式交通信号控制器

本文研究智能城市中的交通信号优化控制问题，通过多智能体强化学习的新分散控制架构和图学习算法，提出了一种新的去中心化控制策略，增强了环境可观测性以抓取交通信号的时空关联性，实验证明该方案优于现有的分散算法。

Nov, 2023

基于深度强化学习的交通灯和自动驾驶车辆的协作控制

为了实现联合国可持续发展目标，此论文提出一种名为 CoTV 的多智能体深度强化学习系统，可协同控制交通信号和连接自动驾驶车辆，以实现减少旅行时间、燃料和排放的目标，且易于部署和维护，并在多种实际城市场景中进行了有效性模拟研究。

Jan, 2022

使用深度强化学习代理控制交通信号

提出了一种交通信号控制系统，利用现代深度强化学习方法构建适应性交通信号控制器，通过对作为输入的交通密集信息进行 Q-learning 训练并使用经验回放，与一种单隐藏层神经网络通讯信号控制器相比，实现了平均累计延迟减少 82％，平均队列长度减少 66％，平均旅行时间减少 20％。

Nov, 2016