Feb, 2021

合作多智能体强化学习中实现技巧和单调性约束的反思

TL;DR本研究调查 QMIX 算法的代码级优化和单调性约束,揭示代码级优化对 QMIX 算法改进的显著影响,并发现在纯协作任务中,单调性约束可以提高样本效率和性能。