Jun, 2024

CoDreamer:基于通信的分散式世界模型

TL;DR在强化学习中,样本效率是一个关键挑战。本研究引入了 CoDreamer,这是 Dreamer 算法在多智能体环境中的扩展,利用图神经网络构建了一个双层通信系统来解决部分可观测性和智能体合作等问题。我们证明了 CoDreamer 比使用 Dreamer 的简单方法具有更强的表达能力,并在各种多智能体环境中展示了其优越性能。