BriefGPT.xyz
Ask
alpha
关键词
flattened one-bit stochastic gradient descent
搜索结果 - 1
扁平化一比特随机梯度下降:受控方差的压缩分布式优化
我们提出了一种在参数服务器框架中实现梯度压缩的分布式随机梯度下降(SGD)的新算法。我们的梯度压缩技术名为压平一位随机梯度下降(FO-SGD),它依赖于两个简单的算法思想:(i)利用抖动技术的一位量化过程,和(ii)在量化之前使用随机快速
→
PDF
2 months ago
Prev
Next