CVLight:利用连接车辆进行自适应交通信号控制的分散式学习
本研究引入了 CycLight,一种新颖的基于循环层次的深度强化学习方法,用于网络级自适应交通信号控制系统。与大多数传统的基于强化学习的交通控制器不同,CycLight 采用了循环层次的策略,使用参数化深度 Q 网络算法同时优化循环长度和分割。该循环层次方法有效减少了频繁数据通信的计算负担,同时增强了实际应用的实用性和安全性。为多智能体协作制定了分散的框架,同时整合了注意机制以准确评估当前交叉口周围环境的影响。在大型合成交通网格上使用微观交通仿真工具 SUMO 对 CycLight 进行了测试。实验结果不仅证明了 CycLight 相对于最先进方法的卓越性能,还展示了其对信息传输延迟的稳健性。
Jan, 2024
提出了一种名为 SocialLight 的基于多智能体强化学习和分布式学习的交通信号控制方法,通过估计个体对本地邻域的边际贡献来学习交通控制策略,解决了传统方法中合作性不足和无法扩展等问题,并经过在两个交通模拟器上的标准基准测试,结果表明 SocialLight 具有更好的可扩展性和更好的性能。
Apr, 2023
为了实现联合国可持续发展目标,此论文提出一种名为 CoTV 的多智能体深度强化学习系统,可协同控制交通信号和连接自动驾驶车辆,以实现减少旅行时间、燃料和排放的目标,且易于部署和维护,并在多种实际城市场景中进行了有效性模拟研究。
Jan, 2022
交通信号控制是一项具有潜力的低成本措施,可以提高交通效率而不影响现有道路基础设施。本篇论文提出了基于增强学习的城市规模高可靠道路网络交通信号控制方法 CityLight,通过参数共享的 MAPPO 优化框架来实现多个智能体的协同控制和大规模异质交叉口的适配,采用邻域集成奖励以达到全局最优。大量实验证明 CityLight 具有出人意料的效果和推广性,整体性能提升 11.66%,在迁移场景中吞吐量提高了 22.59%。
Jun, 2024
本研究探讨了如何提高道路交通信号灯的效率,提出了一种名为 CoLight 的新模型,使用图形注意网络来帮助交通信号之间的通信,实现了更好的交通信号控制表现,并展示了在大规模道路网络中实现的效果。
May, 2019
本文提出了一种基于分散式强化学习的方法 (EMVLight),通过一种创新的 RL 代理人和一种新型的基于压力的奖励函数,该方法可以学习网络级合作交通信号相位策略,不仅可以减少急救车行车时间,还可以缩短其他车辆的行驶时间。通过模拟实验,证明该方法可以使急救车行车时间减少 42.6%,平均行车时间缩短 23.5%。
Jun, 2022
在这项研究中,提出了一个基于强化学习的交通信号控制框架,能有效地处理城市地区持久存在的交通拥堵问题,通过引入交叉口矩阵来刻画交叉口状态,使该模型适用于不同结构的交叉口,并通过定制化的交通状态增强方法增加了处理各种交叉口结构的能力,多个交叉口配置的实验结果证实了该框架的有效性。
Dec, 2023
本文提出了一种名为 EMVLight 的去中心化强化学习框架,用于应急车辆的动态路由和交通信号控制。该框架优于基准运输工程技术和现有的基于强化学习的信号控制方法。
Sep, 2021
该研究报告介绍了一种名为 EcoLight 的奖励塑造方案,用于强化学习算法中,既可以减少二氧化碳排放,又可以在诸如旅行时间之类的指标上获得具有竞争力的结果。该研究比较了采用表格型 Q 学习、DQN、SARSA 和 A2C 算法的性能,使用的指标包括旅行时间、二氧化碳排放、等待时间和停车时间,考虑了多种道路使用者(卡车、公交车、汽车)和不同污染水平的多个场景。
Oct, 2023
该研究提出了一种基于增强数据的强化学习方法来训练适用于不同结构的路口的通用模型,其中包括新的代理设计和数据增强方法,使得该模型的泛化性能更好,可以在 SUMO 交通模拟环境中测试其有效性,并成功将训练时间缩短了 80%,性能跟单一环境训练的模型非常接近。
Oct, 2022