Jun, 2023

交通信号控制与减排的合作式多目标强化学习

TL;DR提出一种合作的多目标架构 MOMA-DDPG 来优化交通信号控制,包含两种类型的代理人,一个代理人关注于优化本地交通,而另一个代理人旨在优化全局交通吞吐量,实验结果表明该方法优于现有的方法,可以最小化等待时间和碳排放。