AAAIMar, 2022

多智能体强化学习中的递归推理图

TL;DR采用递归推理模型和中央训练 - 分散执行框架的多智能体强化学习算法,能够帮助学习代理更好地合作或竞争,取得了多个多智能体粒子和机器人游戏中的最佳性能。