Jun, 2018
非凸随机优化中动量与异步加速权衡的研究
Towards Understanding Acceleration Tradeoff between Momentum and Asynchrony in Nonconvex Stochastic Optimization
Tianyi Liu, Shiyang Li, Jianping Shi, Enlu Zhou, Tuo Zhao
TL;DR本文通过对简单但非平凡的非凸问题 - 流式 PCA 的分析,建立了异步动量随机梯度下降算法 (Async-MSGD) 在流式 PCA 中渐进收敛速率的扩散近似,结果表明异步和动量之间存在根本的权衡:为了通过异步获取收敛和加速,我们必须降低动量 (与 Sync-MSGD 相比),这是对异步 - MSGD 在分布式非凸随机优化中理解的第一次理论尝试。