Dec, 2021

多智能体强化学习中的合作学习

TL;DR本文研究了网络多智能体强化学习(MARL)问题,提出了一种分层分散式MarL框架:LToS,它使代理者能够动态地与邻居共享奖励,从而通过集体鼓励代理者在全局目标上进行合作。实证结果表明LToS在社会困境和网络MARL的情景下都优于现有方法。