Feb, 2021
合作多智能体强化学习中实现技巧和单调性约束的反思
Rethinking the Implementation Tricks and Monotonicity Constraint in Cooperative Multi-Agent Reinforcement Learning
Jian Hu, Siyang Jiang, Seth Austin Harding, Haibin Wu, Shih-wei Liao
TL;DR本研究调查 QMIX 算法的代码级优化和单调性约束,揭示代码级优化对 QMIX 算法改进的显著影响,并发现在纯协作任务中,单调性约束可以提高样本效率和性能。