Jul, 2020

凸光滑函数的动态遗憾

TL;DR本文提出了一种在线凸优化算法,该算法在非稳态环境中表现出优异的动态后悔表现,通过充分利用流畅性条件,能够在动态后悔中代替对 T 的依赖,而采用问题相关的数量:损失函数的梯度变化、比较序列的累积损失和前两个 term 的最小值,从而使问题的复杂度自适应问题的困难程度,即在简单问题上使界限更紧,同时保证了最坏情况下相同的界限。