ICMLMar, 2021

面向交通信号控制的强化学习实际应用

TL;DR本文介绍了一个名为 LemgoRL 的基准工具,为了关闭现有交通信号控制器在简化的模拟环境下不能正确地执行任务的差距,提出在更真实的模拟环境中进行 RL 算法的训练,以在真实世界的交通系统中应用。通过在这个基准工具上训练一个深度 RL 算法的性能表现,论文指出本基准工具推动 RL 算法向着真实世界应用方向的发展。