基于离线强化学习的完全数据驱动实现逼真交通信号控制

Nov, 2023

基于离线强化学习的完全数据驱动实现逼真交通信号控制

A Fully Data-Driven Approach for Realistic Traffic Signal Control Using Offline Reinforcement Learning

Jianxiong Li, Shichao Lin, Tianyu Shi, Chujie Tian, Yu Mei...

TL;DR通过结合交通流理论和机器学习，我们提出了一种全面的数据驱动和免费模拟器的实现逼真交通信号控制框架 (D2TSC)。我们利用历史交通数据构建了一个奖励推断模型，通过粗粒度的交通数据来推断奖励信号，并进一步使用样本高效的离线 RL 方法，从真实世界交叉口的离线历史数据集中直接学习信号控制策略。通过广泛实验证明，我们的方法在传统方法和离线 RL 基准上取得了卓越的性能，并且具有更好的实际应用性。

Abstract

The optimization of traffic signal control (TSC) is critical for an efficient transportation system. In recent years, reinforcement learning (RL) techniques have emerged as a popular approach for TSC and show pro

traffic signal control reinforcement learning real-world applicability data-driven offline rl

发现论文，激发创造

基于轻量级 Transformer 的交通信号控制：离线到在线强化学习方法

DTLight 是一种基于 Decision Transformer 和知识蒸馏的简单而强大的轻量级交通信号控制方法，可从易于获取的离线数据集中学习策略，并通过适配器模块实现在线调整，其在合成和真实场景的广泛实验中表现出色。

Dec, 2023

数据或许足够：离线强化学习桥接现实交通信号控制

本文提出了一种基于循环离线数据集的数据驱动方法来解决真实交通信号控制中部署的问题。在仿真与真实环境中进行了广泛实验，结果表明，引入循环离线数据集的数据驱动方法在某些情况下可以实现令人满意的性能，COD 可以被视为用于交通信号控制问题的可靠离线数据集。

Mar, 2023

用于路面交通管制的离线强化学习技术

本研究基于批量强化学习的方法，运用基于惩罚项的自适应奖励方式在普通的循环交通信号控制策略下，构建出一个马尔可夫决策过程（MDP）的学习框架，不仅提高了对于不同分布情境的管理优化，还显著提高了交通信号控制的效率。

Jan, 2022

真正的交易：将基于强化学习的交通信号控制系统向现实迈进的挑战和机遇综述

本篇研究检验了强化学习对于交通信号控制中的应用，探讨了其中的挑战与不确定性，提出了需要更多系统性思维的研究来解决这些挑战。

Jun, 2022

面向交通信号控制的强化学习实际应用

本文介绍了一个名为 LemgoRL 的基准工具，为了关闭现有交通信号控制器在简化的模拟环境下不能正确地执行任务的差距，提出在更真实的模拟环境中进行 RL 算法的训练，以在真实世界的交通系统中应用。通过在这个基准工具上训练一个深度 RL 算法的性能表现，论文指出本基准工具推动 RL 算法向着真实世界应用方向的发展。

Mar, 2021

使用深度强化学习代理控制交通信号

提出了一种交通信号控制系统，利用现代深度强化学习方法构建适应性交通信号控制器，通过对作为输入的交通密集信息进行 Q-learning 训练并使用经验回放，与一种单隐藏层神经网络通讯信号控制器相比，实现了平均累计延迟减少 82％，平均队列长度减少 66％，平均旅行时间减少 20％。

Nov, 2016

城市交叉口智能交通信号控制的强化学习方法

本文基于强化学习方法提出一种针对城市交叉口交通信号控制的新模型，采用神经网络作为 Q 函数的近似器进行复杂的信号控制，使用开放源代码的交通模拟器 SUMO 进行实验，结果表明该模型能够显著降低排队长度和等待时间，与基准方法相比具有更好的收敛性和泛化性能。

May, 2019

自适应交通信号控制：深度强化学习算法，带有经验回放和目标网络

本文提出了一种利用深度强化学习算法从实时交通原始数据中自动提取所有有用特征（机器制造的特征）并学习适应性交通信号控制的最优策略，以减少车辆延迟时间的方法，并通过模拟实验结果证明，与其他两种流行的交通信号控制算法相比，我们的算法将车辆延迟缩短了 47％和 86％。

May, 2017

UniTSA：一种用于 V2X 交通信号控制的通用强化学习框架

在这项研究中，提出了一个基于强化学习的交通信号控制框架，能有效地处理城市地区持久存在的交通拥堵问题，通过引入交叉口矩阵来刻画交叉口状态，使该模型适用于不同结构的交叉口，并通过定制化的交通状态增强方法增加了处理各种交叉口结构的能力，多个交叉口配置的实验结果证实了该框架的有效性。

Dec, 2023

DenseLight：大规模交通信号的高效密集反馈控制

本研究提出利用无偏奖励函数提供密集反馈信息和非本地增强交通信号控制智能体更好地预测交通状况以实现更精确的交通控制的新型增强学习交通信号控制（TSC）方法，并经过了大量实验和消融研究验证其性能优于先进的基线方法。

Jun, 2023