HumanLight: 交通信号控制中基于人类中心的深度强化学习激励拼车
该研究报告介绍了一种名为 EcoLight 的奖励塑造方案,用于强化学习算法中,既可以减少二氧化碳排放,又可以在诸如旅行时间之类的指标上获得具有竞争力的结果。该研究比较了采用表格型 Q 学习、DQN、SARSA 和 A2C 算法的性能,使用的指标包括旅行时间、二氧化碳排放、等待时间和停车时间,考虑了多种道路使用者(卡车、公交车、汽车)和不同污染水平的多个场景。
Oct, 2023
通过强化学习技术实现道路交通信号控制的自适应,并针对交通事故的发生率,提出了一种安全性增强的残差强化学习方法,实验表明该方法可以显著降低碰撞率并提高交通流动性。
Nov, 2022
本研究提出了一种名为 CVLight 的分散式增强学习方案,应用于多交叉口自适应交通信号控制,利用了来自互联车辆的数据,提出了新算法 Asym-A2C,通过全面的实验,证明 CVLight 在各种交通需求和覆盖率下都优于现有算法,并展示了 Asym-A2C 的优势。
Apr, 2021
该研究提出了一种基于增强数据的强化学习方法来训练适用于不同结构的路口的通用模型,其中包括新的代理设计和数据增强方法,使得该模型的泛化性能更好,可以在 SUMO 交通模拟环境中测试其有效性,并成功将训练时间缩短了 80%,性能跟单一环境训练的模型非常接近。
Oct, 2022
交通信号控制是一项具有潜力的低成本措施,可以提高交通效率而不影响现有道路基础设施。本篇论文提出了基于增强学习的城市规模高可靠道路网络交通信号控制方法 CityLight,通过参数共享的 MAPPO 优化框架来实现多个智能体的协同控制和大规模异质交叉口的适配,采用邻域集成奖励以达到全局最优。大量实验证明 CityLight 具有出人意料的效果和推广性,整体性能提升 11.66%,在迁移场景中吞吐量提高了 22.59%。
Jun, 2024
为了缓解城市交通拥堵问题并提高交通效率,本文提出了一种联合优化方法,使用多智能体深度强化学习(MADRL)来进行交通信号控制和车辆路由的信号化道路网络。通过建立代理之间的联系和共享观察和奖励,促进了代理之间的交互和合作,增强了个体训练。数值实验表明,我们的信号控制和车辆路由的集成方案在提高交通效率方面优于单独控制信号时间或车辆路线。
Oct, 2023
本研究探讨了如何提高道路交通信号灯的效率,提出了一种名为 CoLight 的新模型,使用图形注意网络来帮助交通信号之间的通信,实现了更好的交通信号控制表现,并展示了在大规模道路网络中实现的效果。
May, 2019
车辆信号控制对缓解现代城市交通拥堵有着重大影响。近年来,深度强化学习被广泛应用于该任务,表现出有希望的性能,但也面临许多挑战,如有限的性能和样本效率。为了应对这些挑战,我们提出了 MTLight,通过学习大量交通指标来增强智能体的观察,并构建多个辅助任务和监督任务来学习潜在状态,并使用任务特定特征和任务共享特征来使潜在状态更丰富。在 CityFlow 上进行了大量实验证明 MTLight 具有领先的收敛速度和渐近性能。我们在所有场景中模拟了高峰小时模式,并且结果表明 MTLight 具有高度的适应性。
Apr, 2024