Feb, 2013

具有切换成本和其他自适应对手的在线学习

TL;DR本文研究了预测中的不同类型自适应(非固定的)对手的强度,使用新概念的策略遗憾去衡量玩家的表现,特别关注记忆和切换成本的自适应对手,具有均摊2/3次幂的速率且强度显著较弱。