EMNLPAug, 2018

加速异步随机梯度下降算法在神经机器翻译中的应用

TL;DR为了解决异步随机梯度下降中的样本过期问题并提高性能,我们引入了一种延迟梯度更新的技术,同时采用本地优化器和动量微调使我们的浅层机器翻译系统比优化的基线快 27% ,而 BLEU 得分几乎没有降低。