ICMLMay, 2022

在线非次模代价延迟最小化:从全信息到强化反馈

TL;DR研究在线学习中的非约束非子模最小化问题,并提出了一种基于梯度下降算法的解决方案,其中考虑了非子模函数特殊结构和成本的时滞,证明了算法在静态和延迟情况下的遗憾保证。