Jun, 2018
带有延迟更新的随机梯度下降的紧密收敛分析
A Tight Convergence Analysis for Stochastic Gradient Descent with Delayed Updates
Yossi Arjevani, Ohad Shamir, Nathan Srebro
TL;DR本文提供基于生成函数的优化算法收敛性分析技巧,研究了梯度下降以及随机梯度下降在二次函数上的有限时间收敛性,证明了在有随机噪声的情况下,延迟对算法的影响可以被忽略,且在分布式优化问题上,加入延迟不会影响性能,且可和同步方法相媲美。