Feb, 2020

具有软时间窗口的多车辆路径规划问题:一种多智能体强化学习方法

TL;DR这篇论文提出了一种基于强化学习的名为 “Multi-Agent Attention Model” 的算法,能够利用较长的离线训练时间快速解决城市物流配送中必不可少的 “多车辆路径问题(MVRPSTW)”,该算法以车辆旅游生成过程为基础,提出了一种具有注意力层的编码器 - 解码器框架来迭代地生成多辆车的路径,通过对不同规模的合成网络进行评估,证明该算法的效果优于谷歌 OR-Tools 和传统方法,并验证了模型的稳健性。