Jul, 2019

分布式强化学习中通信高效的多智能体 Actor-Critic 算法

TL;DR本文提出了一种基于随机化和多智能体系统 actor-critic 算法的分布式强化学习算法,旨在通过仅与本地邻居通信,协同优化全局平均回报。通过仅发送两个标量值变量,该算法可以解决强连通图的问题。