Oct, 2016

乐观主义的终结?有限臂线性赌博机的渐近分析

TL;DR这篇研究分析了随机线性赌博机在实例依赖性遗憾方面的异步情况,并得出了最优性的上下界匹配结果,表明基于乐观主义或汤普森抽样的算法将永远无法达到最优速度,甚至在非常简单的情况下也可能与最优解相差无几。