Oct, 2021

V-Learning -- 多智能体强化学习的简单高效去中心化算法

TL;DR使用新类别的分散式算法-V-learning解决了多智能体强化学习中联合行动空间指数级增长的问题,在有限态和操作情况下,能够学习Nash均衡、相关均衡和粗略相关均衡。