Jan, 2024

完全去中心化的合作多智能体强化学习:调查

TL;DR该论文系统地回顾了两种全面分散设置下的全面分散方法,即最大化所有代理的共享奖励和最大化所有代理的个人奖励之和,并讨论了未来研究方向。