Oct, 2023

多智能体决策的屏蔽预训练

TL;DR提出了一种基于 Transformer 架构的 MaskMA 预训练框架,通过分布式执行和部分观察的方式,同时解决了多智能体决策中分布式预训练和执行不匹配以及智能体数量和行动空间多样性的问题,实验结果显示 MaskMA 在多个任务上都表现出色,包括 77.8%的零 - shot 胜率和有效的策略协作和临时团队游戏能力。