Nov, 2022

DynamicLight: 利用 DRL 动态调整交通信号时长

TL;DR本文提出了一个名为 DynamicLight 的两阶段深度强化学习框架,它使用最大队列长度选择正确阶段,并采用深度 Q 学习网络确定相应阶段的持续时间。在此基础上,还引入了两个变体。数字实验表明,DynamicLight 在确定相位持续时间方面可以满足,DynamicLight-Lite 可以与大多数基线方法相匹配或优于大部分基线方法,DynamicLight-Cycle 在当前 TSC 系统方面表现出高性能。