Apr, 2022

融合前瞻性和想象力:基于模型的协作多智能体强化学习

TL;DR本文提出了一种隐式的基于模型的多智能体强化学习方法,基于价值分解方法,能够提高在不同部分可观察的马尔可夫决策过程领域中的样本效率。