Dec, 2013

GPU 异步随机梯度下降加速神经网络训练

TL;DR本文介绍了一种新的系统 ——GPU A-SGD,它同时利用了模型并行和数据并行的方法,加快了卷积神经网络的训练速度,从而可以使大型网络在较短时间内训练大型数据集。