Mar, 2016
分布式随机优化中的数据相关性
On Data Dependence in Distributed Stochastic Optimization
Avleen S. Bijral, Anand D. Sarwate, Nathan Srebro
TL;DR研究分布式一致性的随机梯度下降算法,证明收敛速度与网络拓扑的权值矩阵的标准谱间隙和数据的样本协方差矩阵的谱范数有关,证明分布式 SGD 算法在谱范数较小的数据集合上表现更好, 并限制通信量以实现数据相关的收敛速度,通过在更多节点上分散固定数据数量以最小化二次可微损失函数可提高收敛速度。