Sep, 2021

多智能体强化学习中的信任区域策略优化

TL;DR本文介绍了针对到多智能体强化学习(MARL)的信任区域方法, 并展示了 Heterogeneous-Agent Trust Region Policy Optimisation 和 Heterogeneous-Agent Proximal Policy Optimisation算法的成功应用。