Oct, 2022

共享自主出行服务的预测性车队再定位:一种基于优化和学习的方法

TL;DR本文关注的是在共享AV机动车辆出行服务 (SAMSs) 中,空闲车辆的预测性行驶问题。将该问题建模为马尔可夫决策过程,并提出了一种使用优势 actor-critic (A2C) 方法的强化学习方法, 与基于优化的分配策略协作,学习一个预测性均衡策略。实验证明,该方法通过观察过去的需求并能够预测未来的需求,显著降低了乘客的等待时间。