Feb, 2024

合作博弈理论下的开放式即兴团队合作

TL;DR建立一个从合作博弈理论的视角解释图神经网络在图基策略学习中使用的联合 Q 值表示法,并基于该理论提出了一种新的算法来补充 GPL 中被忽视但有助于学习的关键特征。通过实验证明了该算法在动态团队构成中与 GPL 的性能比较的正确性。