Mar, 2025

PairVDN - 成对分解价值函数

TL;DR本研究解决了在合作多智能体设置中,深度Q学习面临的复杂联合行动空间和信用分配问题的局限性。我们提出了一种新的值函数分解方法PairVDN,通过成对的方式而非单独智能体的方式,提高了表现力,展现了超过传统VDN和QMIX的性能提升。此方法对复杂动态规划最大化算法的要求更高,但在实验环境Box Jump中取得了显著的改进成果。