ICMLMay, 2022
在线非次模代价延迟最小化:从全信息到强化反馈
Online Nonsubmodular Minimization with Delayed Costs: From Full Information to Bandit Feedback
Tianyi Lin, Aldo Pacchiano, Yaodong Yu, Michael I. Jordan
TL;DR研究在线学习中的非约束非子模最小化问题,并提出了一种基于梯度下降算法的解决方案,其中考虑了非子模函数特殊结构和成本的时滞,证明了算法在静态和延迟情况下的遗憾保证。