ACLMar, 2017

神经机器翻译体系结构的大规模探索

TL;DR本研究对神经机器翻译(NMT)架构的超参数进行了首次大规模分析,并报告了标准 WMT 英德翻译任务上数百个实验结果和方差数,相当于超过 25 万 GPU 小时。通过这些实验,得出了新的见解和建议,建立了一个开源 NMT 框架,使研究人员可以轻松地实验新技术并重现最先进的结果。