AAAIMar, 2022
多智能体强化学习中的递归推理图
Recursive Reasoning Graph for Multi-Agent Reinforcement Learning
Xiaobai Ma, David Isele, Jayesh K. Gupta, Kikuo Fujimura, Mykel J. Kochenderfer
TL;DR采用递归推理模型和中央训练 - 分散执行框架的多智能体强化学习算法,能够帮助学习代理更好地合作或竞争,取得了多个多智能体粒子和机器人游戏中的最佳性能。