AAAISep, 2019

多智能体演员 - 评论家算法与分层图注意力网络

TL;DR本文提出了一种基于分层图注意力网络和多智能体 actor-critic 的模型,可以进行多智能体表示学习和多智能体策略学习,通过两种特殊设计的图注意力网络促进多智能体之间的协作和竞争,实现在新任务中的策略迁移并优于其他现有方法。