May, 2021

针对动态团队组合的教练员-球员多智能体强化学习

TL;DR提出COPA框架应对动态团队组合,使用注意力机制协调教练具有全局视图和只能看到部分视图的玩家,通过分配个体策略和自适应通信方法,验证了方法在资源收集任务、救援游戏和星际争霸微观管理任务上的性能。