May, 2016

固定预算最佳臂识别赌博机问题的严格(下界)界限

TL;DR考虑在 $[0,1]$ 区间上的 $K$ 个臂构成的随机赌博机下,使用有限的轮次 $T$ 定位最佳赌博机的问题,证明了在该问题中误判率的最低下界。同时,该结论证明了基于臂的连续拒绝(Successive Rejection)的算法是最优的,填补了固定预算下最佳臂定位问题的上下限差距。