基于 LLM 的仿真到现实交通信号控制迁移

Aug, 2023

基于 LLM 的仿真到现实交通信号控制迁移

LLM Powered Sim-to-real Transfer for Traffic Signal Control

Longchao Da, Minchiuan Gao, Hao Mei, Hua Wei

TL;DR利用大型语言模型（LLMs）通过基于提示的动作转换理解和建模系统动力学，以解决交通信号控制（TSC）任务中从模拟到实际应用的性能差距问题。

Abstract

Numerous solutions are proposed for the traffic signal control (TSC) tasks aiming to provide efficient transportation and mitigate congestion waste. In recent, promising results have been attained by reinforcement learn

traffic signal control reinforcement learning large language models system dynamics promptgat

发现论文，激发创造

LLM 辅助光：利用大型语言模型能力进行复杂城市环境下人类仿真交通信号控制

本研究介绍了一种创新方法，将大型语言模型（LLMs）与交通信号控制系统相结合，提供先进的推理和决策能力，以应对都市交通流量的复杂性和变动性。通过在感知和决策工具套件中引入 LLMs，并将其放置在决策过程的核心位置，以结合外部交通数据和现有的交通信号控制方法，该方法在多种交通环境下表现出无需额外训练即可适应的高效性。在传感器故障情况下，相比传统基于强化学习（RL）的系统，该方法减少了平均等待时间 20.4%。本研究的进展为交通信号控制策略带来重大突破，并为将 LLMs 整合到真实、动态场景中铺平了道路，突显其革命性改变交通管理的潜力。

Mar, 2024

大型语言模型作为交通信号控制代理：容量和机会

LLMLight 通过利用大型语言模型（LLMs）进行交通信号控制任务，实现了人类般的决策过程，确保道路网络的最优效率。

Dec, 2023

基于不确定性感知的基础动作转换：用于交通信号控制的模拟到实际转换

本文提出了一种名为 UGAT 的仿真到真实世界转移方法，通过动态转换模拟中的不确定行动来减小转移动态的领域差异，从而将在仿真环境中训练的学习策略转移到真实环境中，显著提高了转移强化学习策略在真实世界中的性能。

Jul, 2023

面向交通信号控制的强化学习实际应用

本文介绍了一个名为 LemgoRL 的基准工具，为了关闭现有交通信号控制器在简化的模拟环境下不能正确地执行任务的差距，提出在更真实的模拟环境中进行 RL 算法的训练，以在真实世界的交通系统中应用。通过在这个基准工具上训练一个深度 RL 算法的性能表现，论文指出本基准工具推动 RL 算法向着真实世界应用方向的发展。

Mar, 2021

基于离线强化学习的完全数据驱动实现逼真交通信号控制

通过结合交通流理论和机器学习，我们提出了一种全面的数据驱动和免费模拟器的实现逼真交通信号控制框架 (D2TSC)。我们利用历史交通数据构建了一个奖励推断模型，通过粗粒度的交通数据来推断奖励信号，并进一步使用样本高效的离线 RL 方法，从真实世界交叉口的离线历史数据集中直接学习信号控制策略。通过广泛实验证明，我们的方法在传统方法和离线 RL 基准上取得了卓越的性能，并且具有更好的实际应用性。

Nov, 2023

真正的交易：将基于强化学习的交通信号控制系统向现实迈进的挑战和机遇综述

本篇研究检验了强化学习对于交通信号控制中的应用，探讨了其中的挑战与不确定性，提出了需要更多系统性思维的研究来解决这些挑战。

Jun, 2022

语言条件下的交通生成

该研究论文介绍了一种名为 LCTGen 的模型，它结合了大型语言模型和基于变压器的解码器架构，利用语言作为动态交通场景生成的监督来源，其在无条件和条件下的交通场景生成方面表现优于之前的研究，并且在现实感和保真度方面更好。

Jul, 2023

利用领域随机化和元学习来弥合基于强化学习的交通信号控制的现实差距

通过对潜在的模拟参数分析和对两种策略（Domain Randomization 和 Model-Agnostic Meta-Learning）的研究，我们研究了交通信号控制系统中的现实差距问题，并在实验中证明这两种方法优于现有的强化学习算法，有望缓解现实差距。

Jul, 2023

基于语言指导的场景级扩散交通模拟

提出了一种 CTG++ 基于学习的交通流模型，它可以通过语言指令进行指导，从而解决了交通模型控制需要领域专业知识，对实践者使用困难等问题，通过经过广泛的评估，我们展示了该方法在生成实际且符合查询要求的交通仿真方面的有效性。

Jun, 2023

基于预训练大型语言模型的交通预测框架：TPLLM

TPLLM 是一种基于大型语言模型的交通预测框架，通过构建基于 CNN 的序列嵌入层和基于 GCN 的图嵌入层，提取序列特征和空间特征，并与 LLMs 集成，实现在有限历史交通数据地区的准确预测和良好的泛化能力。

Mar, 2024