Sep, 2016

具有延迟补偿的异步随机梯度下降

TL;DR提出了一种新的异步随机梯度下降算法,通过利用梯度函数的泰勒展开和损失函数的快速近似海森矩阵,实现了延迟补偿,从而使ASGD的优化行为更接近于顺序SGD。在CIFAR-10和ImageNet数据集上进行了评估,实验结果表明,DC-ASGD优于同步SGD和异步SGD,几乎接近于顺序SGD的性能。