Booking.com 的机器翻译:历程和经验教训
本文介绍了在大规模电子商务环境中,构建一个内部旅游领域的神经机器翻译系统,并对其进行优化、训练(包括不同的优化策略和语料库规模)、处理现实世界内容以及评估结果等三个主题进行了研究。
Sep, 2017
Google 发布的 GNMT 神经机器翻译系统采用 LSTM 深度学习网络,使用 attention 机制和残差连接,借助词元素 (wordpieces) 将单词划分为子单元,提高了稀有单词处理能力与整体系统精度。
Sep, 2016
本文提出了将 SMT 模型融入 NMT 框架,通过辅助分类器和门函数来结合 SMT 的推荐和 NMT 的生成,从而提高中英翻译的性能。实验结果表明,该方法在多个测试集上均显著优于现有的 NMT 和 SMT 系统。
Oct, 2016
本文追溯了现代神经机器翻译体系结构的起源,重点探讨了单个神经网络在翻译中的应用,其中涉及到 word 和 sentence embedding 以及编码器 - 解码器网络家族的早期示例,并总结了该领域的最新趋势。
Dec, 2019
本研究旨在分享我们在神经机器翻译领域的专业知识,创造出竞争力强且适用于不同用例的翻译引擎,在实际生产流程中实现特定领域的高效翻译。我们提供了一种同时发布多种语言在线演示程序的方法,并探索了不同的实用选项、网络架构和评估方法等。
Oct, 2016
使用词汇短语转换(phrase-based machine translation)方法预处理输入,进而提升神经机器翻译(NMT)的翻译质量,在英德翻译任务中,使用该方法的性能跃升 2 个 BLEU 分数,同时分析了初始系统质量对最终结果的影响。
Oct, 2016
本文分析了神经网络机器翻译(NMT)与基于短语的机器翻译(PBMT)在英语 - 德语翻译数据集上的表现,从专业翻译的高质量后编辑结果中发现神经网络机器翻译在表述动词重新排序等语言现象时具有更好的建模能力,但仍有需要改进的方面。
Aug, 2016
本文研究通过引入更多本地依赖关系和使用单词对齐来学习翻译过程中的句子重新排序,在低资源语言中使用神经机器翻译 (NMT) 模型,产生仅使用 7 万个训练数据令人满意的翻译结果。
Aug, 2017
提出了一种神经机器翻译的方法,利用一种新的候选采样策略,基于强化学习技术提高翻译模型的机器导向性,从而产生最适合用作特定下游任务的自然语言处理组件输入的翻译结果,这种方法可以显著提高英文分类器对 Twitter 数据的情感分类的性能。
Oct, 2019