面向交通信号控制的强化学习实际应用

ICMLMar, 2021

面向交通信号控制的强化学习实际应用

Towards Real-World Deployment of Reinforcement Learning for Traffic Signal Control

Arthur Müller, Vishal Rangras, Georg Schnittker, Michael Waldmann, Maxim Friesen...

TL;DR本文介绍了一个名为 LemgoRL 的基准工具，为了关闭现有交通信号控制器在简化的模拟环境下不能正确地执行任务的差距，提出在更真实的模拟环境中进行 RL 算法的训练，以在真实世界的交通系统中应用。通过在这个基准工具上训练一个深度 RL 算法的性能表现，论文指出本基准工具推动 RL 算法向着真实世界应用方向的发展。

Abstract

Sub-optimal control policies in intersection traffic signal controllers (TSC) contribute to congestion and lead to negative effects on human health and the environment. reinforcement learning (RL) for traffic signal con

reinforcement learning traffic signal control simulation environment benchmark tool real-world applications

发现论文，激发创造

真正的交易：将基于强化学习的交通信号控制系统向现实迈进的挑战和机遇综述

本篇研究检验了强化学习对于交通信号控制中的应用，探讨了其中的挑战与不确定性，提出了需要更多系统性思维的研究来解决这些挑战。

Jun, 2022

基于离线强化学习的完全数据驱动实现逼真交通信号控制

通过结合交通流理论和机器学习，我们提出了一种全面的数据驱动和免费模拟器的实现逼真交通信号控制框架 (D2TSC)。我们利用历史交通数据构建了一个奖励推断模型，通过粗粒度的交通数据来推断奖励信号，并进一步使用样本高效的离线 RL 方法，从真实世界交叉口的离线历史数据集中直接学习信号控制策略。通过广泛实验证明，我们的方法在传统方法和离线 RL 基准上取得了卓越的性能，并且具有更好的实际应用性。

Nov, 2023

城市交叉口智能交通信号控制的强化学习方法

本文基于强化学习方法提出一种针对城市交叉口交通信号控制的新模型，采用神经网络作为 Q 函数的近似器进行复杂的信号控制，使用开放源代码的交通模拟器 SUMO 进行实验，结果表明该模型能够显著降低排队长度和等待时间，与基准方法相比具有更好的收敛性和泛化性能。

May, 2019

基于 LLM 的仿真到现实交通信号控制迁移

利用大型语言模型（LLMs）通过基于提示的动作转换理解和建模系统动力学，以解决交通信号控制（TSC）任务中从模拟到实际应用的性能差距问题。

Aug, 2023

基于不确定性感知的基础动作转换：用于交通信号控制的模拟到实际转换

本文提出了一种名为 UGAT 的仿真到真实世界转移方法，通过动态转换模拟中的不确定行动来减小转移动态的领域差异，从而将在仿真环境中训练的学习策略转移到真实环境中，显著提高了转移强化学习策略在真实世界中的性能。

Jul, 2023

面向交通信号控制的鲁棒深度强化学习：需求激增、事故和传感器故障

本论文详细研究采用深度强化学习（RL）算法解决交通拥堵问题，并开发了一个开源框架以评估这些算法在不同的交通模拟环境下的表现。通过考虑一系列外生不确定因素，如需求激增、容量减少和传感器故障等。我们得出了深度强化学习算法在交通控制领域的关键见解，并提出了具体的设计以减轻这些考虑过的外生不确定因素对系统的影响。

Apr, 2019

UniTSA：一种用于 V2X 交通信号控制的通用强化学习框架

在这项研究中，提出了一个基于强化学习的交通信号控制框架，能有效地处理城市地区持久存在的交通拥堵问题，通过引入交叉口矩阵来刻画交叉口状态，使该模型适用于不同结构的交叉口，并通过定制化的交通状态增强方法增加了处理各种交叉口结构的能力，多个交叉口配置的实验结果证实了该框架的有效性。

Dec, 2023

利用领域随机化和元学习来弥合基于强化学习的交通信号控制的现实差距

通过对潜在的模拟参数分析和对两种策略（Domain Randomization 和 Model-Agnostic Meta-Learning）的研究，我们研究了交通信号控制系统中的现实差距问题，并在实验中证明这两种方法优于现有的强化学习算法，有望缓解现实差距。

Jul, 2023

数据或许足够：离线强化学习桥接现实交通信号控制

本文提出了一种基于循环离线数据集的数据驱动方法来解决真实交通信号控制中部署的问题。在仿真与真实环境中进行了广泛实验，结果表明，引入循环离线数据集的数据驱动方法在某些情况下可以实现令人满意的性能，COD 可以被视为用于交通信号控制问题的可靠离线数据集。

Mar, 2023

基于轻量级 Transformer 的交通信号控制：离线到在线强化学习方法

DTLight 是一种基于 Decision Transformer 和知识蒸馏的简单而强大的轻量级交通信号控制方法，可从易于获取的离线数据集中学习策略，并通过适配器模块实现在线调整，其在合成和真实场景的广泛实验中表现出色。

Dec, 2023