Apr, 2024

MTLight:高效多任务强化学习用于交通信号控制

TL;DR车辆信号控制对缓解现代城市交通拥堵有着重大影响。近年来,深度强化学习被广泛应用于该任务,表现出有希望的性能,但也面临许多挑战,如有限的性能和样本效率。为了应对这些挑战,我们提出了 MTLight,通过学习大量交通指标来增强智能体的观察,并构建多个辅助任务和监督任务来学习潜在状态,并使用任务特定特征和任务共享特征来使潜在状态更丰富。在 CityFlow 上进行了大量实验证明 MTLight 具有领先的收敛速度和渐近性能。我们在所有场景中模拟了高峰小时模式,并且结果表明 MTLight 具有高度的适应性。