Mar, 2024

多智能体路径规划的集成优先混合策略

TL;DR基于多智能体强化学习 (MARL) 的多智能体路径规划 (MAPF) 近来备受关注,我们提出了一种名为 Ensembling Prioritized Hybrid Policies (EPH) 的方法,该方法通过选择性通信模块、基于 Q 学习的算法以及高级推理策略来提高通信方式下 MARL-MAPF 求解器的性能,针对复杂多智能体环境进行了实证评估,并展现了与 MAPF 领域最先进的神经网络方法相竞争的性能。