Sep, 2024

异步多智能体强化学习的协同路径规划

TL;DR本文针对多源-目的地最短路径问题(MSD-SPP)进行研究,旨在最小化所有最短路径的平均旅行时间。提出的异步MARL框架通过对道路网络进行分区和引入新的轨迹收集机制,有效解决了路径规划的效率和异步决策问题,实验结果表明该方法在合成和真实道路网络上均优于现有的规划方法。