Dec, 2013
GPU 异步随机梯度下降加速神经网络训练
GPU Asynchronous Stochastic Gradient Descent to Speed Up Neural Network Training
Thomas Paine, Hailin Jin, Jianchao Yang, Zhe Lin, Thomas Huang
TL;DR本文介绍了一种新的系统 ——GPU A-SGD,它同时利用了模型并行和数据并行的方法,加快了卷积神经网络的训练速度,从而可以使大型网络在较短时间内训练大型数据集。