Oct, 2017

线性赌臂机中纯探索的完全自适应算法

TL;DR本文提出了第一个完全自适应的算法用于求解线性赌博机中的最优选择问题,并且其采样复杂度与已有算法相当。此外,通过模拟实验表明,在合成和真实数据集上均远优于现有的方法。