Jun, 2022

DM$^2$: 分布匹配的去中心化多智能体强化学习

TL;DR本研究讨论无集中式组分和显式通讯的分布式多智能体学习,研究表明分布式匹配技术可用于协调独立智能体之间的协作,开发了一种实用的基于样本轨迹的算法(DM^2),已在 StarCraft 领域验证。