基于 LLM 的仿真到现实交通信号控制迁移
本研究介绍了一种创新方法,将大型语言模型(LLMs)与交通信号控制系统相结合,提供先进的推理和决策能力,以应对都市交通流量的复杂性和变动性。通过在感知和决策工具套件中引入 LLMs,并将其放置在决策过程的核心位置,以结合外部交通数据和现有的交通信号控制方法,该方法在多种交通环境下表现出无需额外训练即可适应的高效性。在传感器故障情况下,相比传统基于强化学习(RL)的系统,该方法减少了平均等待时间 20.4%。本研究的进展为交通信号控制策略带来重大突破,并为将 LLMs 整合到真实、动态场景中铺平了道路,突显其革命性改变交通管理的潜力。
Mar, 2024
本文提出了一种名为 UGAT 的仿真到真实世界转移方法,通过动态转换模拟中的不确定行动来减小转移动态的领域差异,从而将在仿真环境中训练的学习策略转移到真实环境中,显著提高了转移强化学习策略在真实世界中的性能。
Jul, 2023
本文介绍了一个名为 LemgoRL 的基准工具,为了关闭现有交通信号控制器在简化的模拟环境下不能正确地执行任务的差距,提出在更真实的模拟环境中进行 RL 算法的训练,以在真实世界的交通系统中应用。通过在这个基准工具上训练一个深度 RL 算法的性能表现,论文指出本基准工具推动 RL 算法向着真实世界应用方向的发展。
Mar, 2021
通过结合交通流理论和机器学习,我们提出了一种全面的数据驱动和免费模拟器的实现逼真交通信号控制框架 (D2TSC)。我们利用历史交通数据构建了一个奖励推断模型,通过粗粒度的交通数据来推断奖励信号,并进一步使用样本高效的离线 RL 方法,从真实世界交叉口的离线历史数据集中直接学习信号控制策略。通过广泛实验证明,我们的方法在传统方法和离线 RL 基准上取得了卓越的性能,并且具有更好的实际应用性。
Nov, 2023
本篇研究检验了强化学习对于交通信号控制中的应用,探讨了其中的挑战与不确定性,提出了需要更多系统性思维的研究来解决这些挑战。
Jun, 2022
该研究论文介绍了一种名为 LCTGen 的模型,它结合了大型语言模型和基于变压器的解码器架构,利用语言作为动态交通场景生成的监督来源,其在无条件和条件下的交通场景生成方面表现优于之前的研究,并且在现实感和保真度方面更好。
Jul, 2023
通过对潜在的模拟参数分析和对两种策略(Domain Randomization 和 Model-Agnostic Meta-Learning)的研究,我们研究了交通信号控制系统中的现实差距问题,并在实验中证明这两种方法优于现有的强化学习算法,有望缓解现实差距。
Jul, 2023
提出了一种 CTG++ 基于学习的交通流模型,它可以通过语言指令进行指导,从而解决了交通模型控制需要领域专业知识,对实践者使用困难等问题,通过经过广泛的评估,我们展示了该方法在生成实际且符合查询要求的交通仿真方面的有效性。
Jun, 2023
TPLLM 是一种基于大型语言模型的交通预测框架,通过构建基于 CNN 的序列嵌入层和基于 GCN 的图嵌入层,提取序列特征和空间特征,并与 LLMs 集成,实现在有限历史交通数据地区的准确预测和良好的泛化能力。
Mar, 2024