Feb, 2024

多智能体深度强化学习中的联合内在动机

TL;DR多智能体深度强化学习中,稀疏奖励与智能体之间的协调是挑战,本文提出了一种基于联合行为的奖励策略,并通过JIM方法展示了多智能体内在动机在解决需要高协调水平的任务中的重要性。