NIPSMar, 2015

用一个微分方程模拟 Nesterov 的加速梯度下降法:理论和洞见

TL;DR推导出与 Nesterov 加速梯度方法近似等价的二阶常微分方程,该 ODE 可用于分析,可以重启 Nesterov's 方案并且可以证明在目标函数强凸时,其具有线性收敛速率。