AAAINov, 2021
多智能体强化学习中吸收状态的使用与误用
On the Use and Misuse of Absorbing States in Multi-agent Reinforcement Learning
Andrew Cohen, Ervin Teng, Vincent-Pierre Berges, Ruo-Ping Dong, Hunter Henry...
TL;DR本研究通过在 MARL 方法中使用 attention 而非全连接层以及吸收状态的创新架构,解决了后人学分配问题,在代理创建 / 销毁以及传统多智能体协调任务中都显著优于标准框架。