Apr, 2012

基于背包的预算受限多臂赌博机最优策略

TL;DR对于受预算限制的多臂赌博机问题,本论文提出了两种拉动策略 KUBE 和分数 KUBE,并证明了两种策略的遗憾具有对数上限,且这个上限是渐近最优的。