Mar, 2023

数据或许足够:离线强化学习桥接现实交通信号控制

TL;DR本文提出了一种基于循环离线数据集的数据驱动方法来解决真实交通信号控制中部署的问题。在仿真与真实环境中进行了广泛实验,结果表明,引入循环离线数据集的数据驱动方法在某些情况下可以实现令人满意的性能,COD 可以被视为用于交通信号控制问题的可靠离线数据集。