Oct, 2019

无投影赌博凸优化改进遗憾界

TL;DR本文提出一种基于条件梯度法的 projection-free 的算法,通过线性优化预测每一轮的动作并达到了 $O(T^{3/4})$ 的预期最小化损失 (expected regret)。