Jul, 2023

基于事件的深度强化学习应用于动态车辆调度问题

TL;DR本文提出了一种基于半马尔可夫决策过程和离散事件模拟的动态车辆调度问题解决方法,并在纽约市的真实场景下进行了数值实验,结果显示相对于其他启发式策略,该方法的平均等待时间减少了50%。