Oct, 2019

在线连续子模最大化:从完全信息到Bandit反馈

TL;DR本文提出了三种在线算法,分别用于子模最大化问题中的函数渐变计算优化、带赌博的子模最大化问题和响应式带乘积集约束的带乘积子模问题。三个算法在达到 $(1-1/e)$ -regret bound 的前提下,分别取得了复杂度为$O(T^{4/5})$、$O(T^{8/9})$ 以及$O(T^{8/9})$ 的折损。