Jun, 2018

非凸随机优化中动量与异步加速权衡的研究

TL;DR本文通过对简单但非平凡的非凸问题 - 流式 PCA 的分析,建立了异步动量随机梯度下降算法 (Async-MSGD) 在流式 PCA 中渐进收敛速率的扩散近似,结果表明异步和动量之间存在根本的权衡:为了通过异步获取收敛和加速,我们必须降低动量 (与 Sync-MSGD 相比),这是对异步 - MSGD 在分布式非凸随机优化中理解的第一次理论尝试。