Nov, 2022

自适应可变需求的自主路由和取货问题的多智能体强化学习

TL;DR提出了一个通过自适应路由策略降低等待时间、考虑未来需求以及能够适应不同需求分布的自主汽车调度和接送框架,该框架通过线上游戏算法和线下逼近方案相结合,在美国旧金山的实际出租车需求中得到了验证。