Jun, 2015

一种高效的含背包限制多臂赌博算法,以及对凹目标问题的扩展

TL;DR研究了具有全局背包限制条件下的上下文多臂赌博问题,提出了一种计算效率更高、后悔更低的算法,复杂度与策略空间的大小成对数关系,并将结果推广到一种没有背包限制但目标是任意 Lipschitz 凹函数的变体。