Mar, 2019
随机线性赌博机的扰动历史探索
Perturbed-History Exploration in Stochastic Linear Bandits
Branislav Kveton, Csaba Szepesvari, Mohammad Ghavamzadeh, Craig Boutilier
TL;DR提出了一种新的在线算法 LinPHE,用于最小化随机线性赌博机中的累积遗憾,该算法通过构建扰动历史来达到目的,并获得了关于线性模型的高性能预测模型,在包括逻辑回归模型的各种场景中都具有可行性。