Oct, 2022

具有状态的主动协调器:协作多智能体强化学习中的协调和环境异质性

TL;DR本研究提出了一个多智能体协作系统,使用 HE COGrid 评估了不同 MARL 方法的表现,并通过 SAF 的中心化训练去集中协调,并在不同环境异构性的情况下执行,得出了 SAF 在不同的任务和协调水平下总是表现出色相比于其他方法。