BriefGPT.xyz
Ask
alpha
关键词
centralised training
搜索结果 - 2
多智体价值分解中的冗余挑战
通过使用层次相关传播,我们将联合价值函数的学习与本地奖励信号的生成分开,提出了一个新的合作多智能体增强学习算法:相关分解网络。我们发现,尽管 VDN 和 Qmix 的性能会随着冗余智能体数目的增加而降低,但 RDN 则不受影响。
PDF
a year ago
AAAI
QVMix 和 QVMix-Max:将深度质量 - 值算法扩展到合作多智能体强化学习
本文介绍了四种新算法:IQV,IQV-Max,QVMix 和 QVMix-Max,用于解决协作环境下发生的多智能体强化学习(MARL)问题。作者比较了这些算法和现有的 MARL 技术,并表明 QVMix 在测试环境中表现最佳,其优于其他算法
→
PDF
4 years ago
Prev
Next