通过长步长可证明更快的梯度下降算法

Jul, 2023

通过长步长可证明更快的梯度下降算法

Provably Faster Gradient Descent via Long Steps

Benjamin Grimmer

TL;DR本研究利用计算机辅助分析技术，建立了梯度下降的收敛速度证明，并通过分析多次迭代的总体效果，描述了长步策略可能违反下降性质但能实现更快的收敛速度。

Abstract

This work establishes provably faster convergence rates for gradient descent via a computer-assisted analysis technique. Our theory allows nonconstant →