Mar, 2024

多智能体强化学习中推断潜在时间稀疏协调图

TL;DR在合作多智能体强化学习中,有效的智能体协调至关重要。为了解决现有方法中对历史经验的忽视和稠密图计算的可扩展性问题,我们提出了一种基于潜在时间稀疏协调图的多智能体强化学习方法。该方法利用智能体的历史观测计算智能体对概率矩阵,并基于此矩阵生成稀疏图,以促进智能体之间的知识交流,同时捕捉智能体之间的依赖关系和关系不确定性。该方法还引入了 “预测未来” 和 “推断现在” 两个创新特性,使得该方法能够从有限数据中构建历史和实时信息的时间图,促进策略学习和有效协作。实验结果表明,该方法在 StarCraft II 基准测试中具有卓越的性能。