Mar, 2022

交通信号控制的随机集成强化学习

TL;DR该研究提出一种名为 RElight 的动态学习交通信号控制策略的模型,并结合随机集成学习方法以避免陷入局部最优结果。研究还引入了 UTD 比率以控制数据重用数量,以提高数据利用率并在合成数据和实际数据上进行了实验以证明该方法优于现有最优方法。