AAAINov, 2022

ACE: 双向行动依赖的协作多智能体 Q-learning

TL;DR此研究提出了双向依赖 Q-learning(ACE)方法,通过设计正确的网络表示,在顺序决策过程中隐式计算以解决多智能体强化学习中的非静态问题,并通过比较实践验证 ACE 超越了 Google Research Football 和 StarCraft 多智能体挑战中其他算法。