BriefGPT.xyz
Ask
alpha
关键词
distributed parallel implementations
搜索结果 - 1
误差反馈框架:延迟梯度和压缩通信下提高 SGD 速率
本文研究了在平滑拟凸和非凸函数上的随机梯度下降法(SGD)进行延迟更新,并得出了简洁的非渐近收敛速度。我们证明了在所有情况下收敛速度的由两个项组成:(i)一个随机项,不受延迟的影响,和(ii)一个更高阶的确定性项,只是通过延迟线性减缓。因此
→
PDF
5 years ago
Prev
Next