Aug, 2016

针对最佳臂识别的实例最优界限

TL;DR解决乐观抽样的样本复杂度问题,提出了一种高度非平凡的算法来提供最大均值臂的实例 wise 样本复杂度上界,同时对于任意的高斯贝叶斯多臂老虎机有一定的下界。