ICMLOct, 2018

多智能体强化学习的演员 - 注意力 - 评论家模型

TL;DR提出了一个基于 Actor-Critic 算法的多智能体强化学习算法,解决了多智能体场景下的信息筛选问题,可应用于大多数多智能体学习问题。