Aug, 2022
异质代理镜像学习:协作多智能体强化学习的一系列解决方案
Heterogeneous-Agent Mirror Learning: A Continuum of Solutions to
Cooperative MARL
TL;DR本文介绍了一种名为异构代理镜像学习(HAML)的新型框架,该框架提供了一种通用的MARL算法设计模板,解决了在奖励单调性或收敛时的非最优性能问题,通过证明来自HAML模板的算法满足单调改进联合奖励和收敛到纳什均衡的期望属性,并通过在星际争霸II和多智能体MuJoCo任务中验证了HAML的实用性。