Sep, 2014

朝着专家建议预测的最优算法

TL;DR本文研究了在对手设置下采用几何停止时间进行专家建议的预测经典问题。对于2个专家的情况,Cover提出了最优算法。对于三个专家的情况,我们设计了最优算法和对手,并证明了该算法与一个特定的随机对手的概率匹配算法(类似于汤普森抽样)是最优的,该证明显示概率匹配算法不仅针对这个特定的随机对手是最优的,而且是极小化的。同时我们通过主对偶(primal-dual)方法同时发展了上限和下限,并为任意数量的专家设计了最优算法和对手的通用框架。