ICMLJun, 2020

多智能体特征行列式 Q 学习

TL;DR本文提出一种基于 Q-DPP 的多智能体 Q 学习方法,用于解决分布式合作任务中的中心化训练和分散执行,消除了限制性假设,并通过采样投影采样器在各种合作基准测试中证明了算法的有效性。