DynamicLight: 利用 DRL 动态调整交通信号时长

Nov, 2022

DynamicLight: 利用 DRL 动态调整交通信号时长

DynamicLight: Dynamically Tuning Traffic Signal Duration with DRL

Liang Zhang, Qiang Wu, Jun Shen, Linyuan Lü, Bo Du...

TL;DR本文提出了一个名为 DynamicLight 的两阶段深度强化学习框架，它使用最大队列长度选择正确阶段，并采用深度 Q 学习网络确定相应阶段的持续时间。在此基础上，还引入了两个变体。数字实验表明，DynamicLight 在确定相位持续时间方面可以满足，DynamicLight-Lite 可以与大多数基线方法相匹配或优于大部分基线方法，DynamicLight-Cycle 在当前 TSC 系统方面表现出高性能。

Abstract

deep reinforcement learning (DRL) is becoming increasingly popular in implementing traffic signal control (TSC). However, most existing DRL methods employ fixed control strategies, making traffic signal

deep reinforcement learning traffic signal control two-stage framework phase duration numerical experiments

发现论文，激发创造

CycLight：使用循环级策略学习交通信号配合

本研究引入了 CycLight，一种新颖的基于循环层次的深度强化学习方法，用于网络级自适应交通信号控制系统。与大多数传统的基于强化学习的交通控制器不同，CycLight 采用了循环层次的策略，使用参数化深度 Q 网络算法同时优化循环长度和分割。该循环层次方法有效减少了频繁数据通信的计算负担，同时增强了实际应用的实用性和安全性。为多智能体协作制定了分散的框架，同时整合了注意机制以准确评估当前交叉口周围环境的影响。在大型合成交通网格上使用微观交通仿真工具 SUMO 对 CycLight 进行了测试。实验结果不仅证明了 CycLight 相对于最先进方法的卓越性能，还展示了其对信息传输延迟的稳健性。

Jan, 2024

强化学习的红绿灯控制

本研究提出一种实时交通信号灯控制方法，使用深度 Q 学习，并结合奖励函数，考虑排队长度、延迟、旅行时间和吞吐量，通过根据当前交通状况动态决定相位变化。通过使用合成和实际交通流数据在中国杭州的一个路口进行验证，结果表明与传统的固定信号计划相比，该方法显著改善了车辆等待时间（57.1% 至 100%）、排队长度（40.9% 至 100%）和总行程时间（16.8% 至 68.0%）。

Aug, 2023

降低骑行者等待交通灯时间成本的 DRL 解决方案

自行车骑手偏向使用能够将他们与机动车流分离的基础设施。将交通信号灯用于分离汽车和自行车流，同时增加自行车专用绿灯阶段，是一种轻量且廉价的解决方案，可动态部署以评估是否需要更重的基础设施，例如独立的自行车道。为了弥补这些新阶段引起的等待时间增加，我们在本文中介绍了一种深度强化学习解决方案，它根据交通情况调整交通信号灯的绿灯周期。通过分析车辆计数数据，我们将这种深度强化学习方法与主动式交通信号灯控制算法进行了比较。结果表明，几乎在所有时间段内，深度强化学习能够更好地最小化车辆等待时间。我们的深度强化学习方法还能够适应自行车交通量的适度变化。欢迎访问本文提供的代码链接。

Nov, 2023

AttentionLight: 交通信号控制中重新思考队列长度和注意力机制

本文针对交通信号控制中容易忽略交通状态表达的问题，通过重新设计车辆排队长度、提出任务状态表示队列长度 QL 及其基于自注意力机制的交通信号控制方法 AttentionLight 实现了交通信号控制的优化，同时通过对多组真实数据集进行全面实验验证了 M-QL 方法和 AttentionLight 方法同传统的 RL 方法相比取得了更优表现。

Dec, 2021

DynLight：多层次信号控制实现动态相位时长

因语言和理论描述存在不足，作者引文修订与更新，故撤回本文。

Apr, 2022

基于轻量级 Transformer 的交通信号控制：离线到在线强化学习方法

DTLight 是一种基于 Decision Transformer 和知识蒸馏的简单而强大的轻量级交通信号控制方法，可从易于获取的离线数据集中学习策略，并通过适配器模块实现在线调整，其在合成和真实场景的广泛实验中表现出色。

Dec, 2023

DenseLight：大规模交通信号的高效密集反馈控制

本研究提出利用无偏奖励函数提供密集反馈信息和非本地增强交通信号控制智能体更好地预测交通状况以实现更精确的交通控制的新型增强学习交通信号控制（TSC）方法，并经过了大量实验和消融研究验证其性能优于先进的基线方法。

Jun, 2023

自适应交通信号控制：深度强化学习算法，带有经验回放和目标网络

本文提出了一种利用深度强化学习算法从实时交通原始数据中自动提取所有有用特征（机器制造的特征）并学习适应性交通信号控制的最优策略，以减少车辆延迟时间的方法，并通过模拟实验结果证明，与其他两种流行的交通信号控制算法相比，我们的算法将车辆延迟缩短了 47％和 86％。

May, 2017

应用强化学习优化交通信号灯周期

本文提出了使用强化学习来实时优化交通灯周期的方法，并通过使用 Simulation Urban Mobility 模拟器进行深度 Q 网络算法的训练进行了案例研究。实验结果显示，平均紧急停车数量减少了 44.16％，显示了我们的方法减少交通拥堵和改善交通流的潜力。此外，我们讨论了未来研究和强化学习模型的改进方向。

Feb, 2024

智能交通系统中的交通灯深度强化学习控制

本篇论文通过研究深度强化学习在交通灯控制问题中的应用，证明在格网路网中智能行驶的 “绿波” 策略自然而然地出现，并且优于传统方法，这为提高交通效率提供了途径。

Feb, 2023