Dec, 2018

网络智能体分散批次多智能体强化学习的有限样本分析

TL;DR本文提供了分布式 batch MARL 的有限样本分析,比较传统单智能体强化学习的有限样本错误较大,由于分布式计算造成的,这是对一般MARL算法在有限样本范围内严格的理论理解的一步。