Oct, 2018

多智能体共识强化学习

TL;DR本文提出一种基于多智能体共有信息的分层策略树的算法(MACKRL)实现复杂的去中心化协调,其中每个智能体可以独立地学习策略,并根据其共同知识进行协调,并在包括随机矩阵游戏和StarCraft II单元微管理等任务上实现更好的性能。