Feb, 2022

对抗无悔玩家

TL;DR研究使用无遗憾算法在正态形式重复的N人博弈中,如何让人类玩家获得最大化效用,引入Stackelberg均衡和相关Stackelberg均衡的概念,证明玩家能够在每个回合至少保证相关Stackelberg期望值的效用。