Sep, 2019

多智能体展开算法与强化学习

TL;DR本文介绍了一种基于本地回滚算法的多智能体决策方法,该方法通过配合其他智能体的协调信息,在每个阶段使每个智能体的决策都能够独立计算,并且与智能体数量无关。此外,我们探讨了并行化智能体计算和近似策略迭代算法等方法来进一步提高本方法的计算效率,并证明了本文算法可以收敛到智能体的最优策略。