本研究探讨了如何提高道路交通信号灯的效率,提出了一种名为 CoLight 的新模型,使用图形注意网络来帮助交通信号之间的通信,实现了更好的交通信号控制表现,并展示了在大规模道路网络中实现的效果。
May, 2019
该论文提出了一种协作多目标多智能体深度再强化学习算法(COMMA-DDPG),用于交通信号控制的全局优化和减少延迟等待时间。该算法在真实的亚洲交通数据集上进行了评估,相比目前最先进的方法,成功地减少了 60%的延迟时间。
May, 2022
通过强化学习技术实现道路交通信号控制的自适应,并针对交通事故的发生率,提出了一种安全性增强的残差强化学习方法,实验表明该方法可以显著降低碰撞率并提高交通流动性。
Nov, 2022
交通信号控制是一项具有潜力的低成本措施,可以提高交通效率而不影响现有道路基础设施。本篇论文提出了基于增强学习的城市规模高可靠道路网络交通信号控制方法 CityLight,通过参数共享的 MAPPO 优化框架来实现多个智能体的协同控制和大规模异质交叉口的适配,采用邻域集成奖励以达到全局最优。大量实验证明 CityLight 具有出人意料的效果和推广性,整体性能提升 11.66%,在迁移场景中吞吐量提高了 22.59%。
Jun, 2024
该论文提出了一个基于深度强化学习的交通协同优化框架,用于增强无信号道路交叉口的驾驶安全性和路段通行能力,其最重要的优点是将计算时间复杂度降低到毫秒级并能够应对不同车道数量的高扩展性。
该研究报告介绍了一种名为 EcoLight 的奖励塑造方案,用于强化学习算法中,既可以减少二氧化碳排放,又可以在诸如旅行时间之类的指标上获得具有竞争力的结果。该研究比较了采用表格型 Q 学习、DQN、SARSA 和 A2C 算法的性能,使用的指标包括旅行时间、二氧化碳排放、等待时间和停车时间,考虑了多种道路使用者(卡车、公交车、汽车)和不同污染水平的多个场景。
Oct, 2023
本文研究了一种通过马尔可夫决策过程和强化学习算法来优化交通信号控制的方法,使用模拟软件 SUMO 模拟了一个城市交叉口,讨论了循环调度器,反馈控制机制和深度 Q 网络等不同策略及其对交通流的影响,最终在班加罗尔的一个真实交叉口进行了测试验证。
Sep, 2021
本文基于强化学习方法提出一种针对城市交叉口交通信号控制的新模型,采用神经网络作为 Q 函数的近似器进行复杂的信号控制,使用开放源代码的交通模拟器 SUMO 进行实验,结果表明该模型能够显著降低排队长度和等待时间,与基准方法相比具有更好的收敛性和泛化性能。
LLMLight 通过利用大型语言模型(LLMs)进行交通信号控制任务,实现了人类般的决策过程,确保道路网络的最优效率。
Dec, 2023
为了实现联合国可持续发展目标,此论文提出一种名为 CoTV 的多智能体深度强化学习系统,可协同控制交通信号和连接自动驾驶车辆,以实现减少旅行时间、燃料和排放的目标,且易于部署和维护,并在多种实际城市场景中进行了有效性模拟研究。
Jan, 2022