Mar, 2019

不带替换的SGD:一般平滑凸函数更锐利的速率

TL;DR本文提出了一种新的随机梯度下降算法sgdwor来优化平滑凸函数,相较于使用独立且重复地采样的传统算法sgd,sgdwor算法采样不重复且能获得更快的收敛速度,本文给出了sgdwor算法在一般的平滑且强凸函数下的首个非渐进结果:k次通信传输后,sgdwor算法的收敛速度为O(1/k^2),并与sgd算法在小k下具有相同收敛率,同时对问题相关参数(如条件数)的依赖性更弱。