Jul, 2022

StarCraft多智能体挑战+: 在没有精确奖励函数的情况下学习多阶段任务和环境因素

TL;DR本文提出了一个叫做SMAC + 的新型基准,该基准旨在探索MARL算法在StarCraft遊戲中学习隐含的多阶段任务、环境因素和微控制的能力。在攻击和防御场景中,该基准要求智能体进行多方面探索,进一步提高算法的探索能力。研究结果表明,近年来的一些算法在该基准中表现良好,但在攻击场景方面表现不佳,为未来的研究提供了新的方向。