Jul, 2024

iLLM-TSC:基于集成强化学习和大型语言模型的交通信号控制策略优化

TL;DR通过将大型语言模型与强化学习相结合,我们提出了一个新颖的集成框架,旨在管理奖励函数中被忽视的元素和状态信息中的缺陷,从而增强强化学习代理的策略。经过广泛测试,我们的方法在降级通信条件下将平均等待时间减少了17.5%,突显了在智能交通系统中推进实际强化学习应用的潜力。