BriefGPT.xyz
Ask
alpha
关键词
nmt architecture
搜索结果 - 3
ACL
神经机器翻译体系结构的大规模探索
本研究对神经机器翻译(NMT)架构的超参数进行了首次大规模分析,并报告了标准 WMT 英德翻译任务上数百个实验结果和方差数,相当于超过 25 万 GPU 小时。通过这些实验,得出了新的见解和建议,建立了一个开源 NMT 框架,使研究人员可以
→
PDF
7 years ago
通过剪枝压缩神经机器翻译模型
本文探讨了三种基于大小的剪枝模式对 NMT 模型进行压缩,通过实验证明了剪枝技术是一种有效的压缩技术,并且可以通过再训练来恢复或甚至超越原始性能。
PDF
8 years ago
ACL
使用单语数据改进神经机器翻译模型
通过将单语数据与自动背景翻译配对,我们未改变神经网络结构,使用目标语单语训练数据进行神经机器翻译(NMT)模型的训练,并在多项任务上取得最新的最优结果(最高 + 2.8-3.7 BLEU),并证明了使用领域单语和平行数据进行微调,对 IWS
→
PDF
9 years ago
Prev
Next