Sep, 2021
多智能体强化学习中的信任区域策略优化
Trust Region Policy Optimisation in Multi-Agent Reinforcement Learning
TL;DR本文介绍了针对到多智能体强化学习(MARL)的信任区域方法, 并展示了 Heterogeneous-Agent Trust Region Policy Optimisation 和 Heterogeneous-Agent Proximal Policy Optimisation算法的成功应用。