MMJun, 2020

多智体强化学习中的共享经验演员 - 评论家算法

TL;DR提出了一种名为 SEAC 的算法,该算法应用经验共享策略来提高多智能体强化学习过程中的探索效率,实验结果表明,该算法在稀疏奖励的多智能体环境中,表现优于其他两种基线算法和两种现有算法,在更加困难的环境下甚至可以解决有些无法学会的任务。