May, 2023

利用单元级注意状态表示增强协作多智能体强化学习的价值分解

TL;DR该研究提出了一种名为UNSR的方法用于协作多智能体加强学习中通过局部观察产生紧凑的潜在表示进行协调和提高价值分解效率,结果表明该方法比基线算法在StarCraft II微观管理挑战中具有更好的性能和数据效率,并且额外的消融实验帮助确定了UNSR性能的关键因素。