BriefGPT.xyz
Mar, 2025
PairVDN - 成对分解价值函数
PairVDN - Pair-wise Decomposed Value Functions
HTML
PDF
Zak Buzzard
TL;DR
本研究解决了在合作多智能体设置中,深度Q学习面临的复杂联合行动空间和信用分配问题的局限性。我们提出了一种新的值函数分解方法PairVDN,通过成对的方式而非单独智能体的方式,提高了表现力,展现了超过传统VDN和QMIX的性能提升。此方法对复杂动态规划最大化算法的要求更高,但在实验环境Box Jump中取得了显著的改进成果。
Abstract
Extending
Deep Q-Learning
to cooperative multi-agent settings is challenging due to the exponential growth of the joint action space, the non-stationary environment, and the
Credit Assignment Problem
.
→