Dec, 2023

非参数策略检验

TL;DR我们提出了一种非参数统计检验方法,用于确定一个代理是否在一次次的博弈中遵循了给定的混合策略,通过代理的对局样本。我们的综合测试包含两个组成部分:确定代理的纯策略频率是否足够接近目标频率,以及确定选出的纯策略是否在不同的游戏迭代之间相互独立。我们的综合测试将应用卡方拟合优度检验作为第一部分,应用广义的Wald-Wolfowitz顺序检验作为第二部分。两个测试的结果将通过Bonferroni校正进行合并,从而得到在给定显著性水平α下的完整检验。我们将该测试应用于公开可获得的人类石头剪刀布对局数据上。该数据包含500位人类玩家50次对局的情况。我们使用显著性水平α=0.05,得出结论称,305位(61%)玩家遵循了目标策略。