ICMLFeb, 2021

随机梯度剪裁的稳定性和收敛性:超越 Lipschitz 连续性和平滑性

TL;DR本文提出了一种修剪随机梯度(子)梯度法(SGD)的收敛性研究,特别是对于具有快速增长次梯度的非光滑凸函数。研究表明,修剪对 SGD 的稳定性有益,并且修剪 SGD 算法在许多情况下具有有限的收敛速率。同时,我们还研究了带有动量的修剪方法的收敛性,并展示了新的 Lyapunov 分析证明了该方法在这类问题中具有最佳的收敛速率。数值结果验证了理论结果。