Feb, 2015

组合半弦臂算法的一阶遗憾上界

TL;DR本文研究了在线组合优化问题中的半盲反馈,提出了一种优化算法来减少期望后悔。该算法以 L_T * 的平方根为增长率,在部分反馈方案中首次实现了此类保证,并在组合设置中首次实现了此类保证。