AAAINov, 2021

多智能体强化学习中吸收状态的使用与误用

TL;DR本研究通过在 MARL 方法中使用 attention 而非全连接层以及吸收状态的创新架构,解决了后人学分配问题,在代理创建 / 销毁以及传统多智能体协调任务中都显著优于标准框架。