ICMLFeb, 2017

广义线性情境赌博机的可证明最优算法

TL;DR本文提出了针对广义线性情境臂的上界置信度算法,实现了与众不同的性能,同时我们还分析了更简单的上界置信度算法,在特定情况下证明了该算法具有最优的后悔。