Mar, 2021

PPO 在合作多智能体游戏中令人惊讶的有效性

TL;DR本研究通过四个流行的多智能体测试环境,证明了基于 PPO 的多智能体算法表现出令人惊讶的性能,并降低了样本复杂度,显示出它可以成为协同多智能体强化学习中的强基线方法。