NIPSApr, 2015

具有对数或次线性遗憾的约束上下文臂机算法

TL;DR本文对具有预算和时间限制的约束情境赌博问题展开了研究,提出了一种高效算法 UCB-ALP 以实现对其进行近似求解并达到对数遗憾。