Mar, 2023

多智体价值分解中的冗余挑战

TL;DR通过使用层次相关传播,我们将联合价值函数的学习与本地奖励信号的生成分开,提出了一个新的合作多智能体增强学习算法:相关分解网络。我们发现,尽管VDN和Qmix的性能会随着冗余智能体数目的增加而降低,但RDN则不受影响。