IJCAIFeb, 2019

AdaLinUCB: 基于上下文的赌博机的机会学习

TL;DR本文主要研究机遇上下文奖励问题,提出了自适应上界置信区间算法(AdaLinUCB),并实现了 O((log T )^ 2)的问题相关遗憾上界证明。