Mar, 2023

通过边际支付在多人随机博弈中学习战略价值与合作

TL;DR本研究提出了计算Harsanyi-Shapley值的简单公式,探讨了将其推广到随机游戏中的两种方法,并在三个或更多玩家的随机网格游戏中通过实证验证了一种使用广义Q-learning算法计算HS值的方法。