BriefGPT.xyz
Mar, 2023
多智体价值分解中的冗余挑战
The challenge of redundancy on multi-agent value factorisation
HTML
PDF
Siddarth Singh, Benjamin Rosman
TL;DR
通过使用层次相关传播,我们将联合价值函数的学习与本地奖励信号的生成分开,提出了一个新的合作多智能体增强学习算法:相关分解网络。我们发现,尽管VDN和Qmix的性能会随着冗余智能体数目的增加而降低,但RDN则不受影响。
Abstract
In the field of
cooperative multi-agent reinforcement learning
(MARL), the standard paradigm is the use of
centralised training
and
decentralised
→