May, 2023

深度强化学习在极端拥堵期间最大化动脉使用率

TL;DR本研究提出了一种基于深度强化学习的控制器来帮助减少道路拥堵现象,该控制器通过学习适应性绕道策略,从而优化使用高速公路车道及其附近的交通网络,本文使用实际交通数据生成参数化交通模型并在模拟器中进行实验,结果显示该方法可以将交通速度提高 21%。