Feb, 2024

自适应近端梯度方法的普适性无需近似

TL;DR通过分析,我们展示了对于凸问题,自适应的近端梯度方法不受传统的 Lipschitzian 假设的限制。我们的分析揭示了一类无需线搜索的方法仍然在纯粹的局部 Hölder 梯度连续性下收敛,特别是连续可微分的半代数函数。为了解决局部 Lipschitz 连续性的缺失,流行的方法围绕着 ε- 预测器和 / 或线搜索程序。相反,我们利用 Hölder 不等式,而不需要任何近似,同时保持自适应方案的无需线搜索的特性。此外,我们在先验地不了解局部 Hölder 常数和 Hölder 连续性的阶的情况下,证明了完全序列的收敛性。在数值实验中,我们将其与基准方法在涵盖局部和全局 Hölder 设置的各种机器学习任务中进行比较。