May, 2024

每轮只需 1 个投影的通用在线凸优化

TL;DR通过黑匣子减少,我们使用简化域上定义的替代损失函数,构建了一种只需要进行一次投影的通用 OCO 算法,对于一轮在线问题,我们维护每种类型函数的一组专家,并通过元算法聚合他们的预测。我们的方法的关键在于针对强凸函数设计的专家损失函数,并通过创新地将遗憾分解为元遗憾和专家遗憾,从而对替代损失函数的遗憾和原损失函数的遗憾之间的差异进行了严格的研究,并在强凸性条件下仔细控制了元遗憾。通过这种方式,我们建立了一轮中的通用凸函数、指数凹函数和强凸函数的最优遗憾上界,并通过增强专家损失函数来利用光滑性质,从而证明了我们的算法可以达到多种类型的凸函数和光滑函数的小损失遗憾。