Jun, 2018

神经机器翻译的扩展

TL;DR通过采用降低精度和大批量培训,结合仔细的调整和实施,可以在单个 8-GPU 计算机上加速训练近 5 倍,从而达到在大型基准数据集上达到最先进性能的状态,如 WMT'14 英德翻译等任务。