ICMLMar, 2022

PMIC: 用渐进式互信息协作改进多智能体强化学习

TL;DR提出了一种 MARL 框架,叫做渐进式互信息协作(PMIC),其通过最大化优秀协作行为相关的互信息和最小化次优协作行为相关的互信息以促进更好的协作,并避免陷入次优协作行为,实验结果表明,PMIC 相较于其他算法具有优异的表现。