利用语义单元增强神经机器翻译

EMNLPOct, 2023

Enhancing Neural Machine Translation with Semantic Units

Langlin Huang, Shuhao Gu, Zhuocheng Zhang, Yang Feng

TL;DR我们提出了一种 Semantic Units for Machine Translation (SU4MT) 方法，通过模型化句子中的语义单元，并利用它们来为理解句子提供新的视角。实验结果表明，我们的方法能有效地建模和利用语义单元级别的信息，并优于强基线模型。

Abstract

Conventional neural machine translation (NMT) models typically use subwords and words as the basic units for model input and comprehension. However, complete words and phrases composed of several tokens are often the fundamental units for expressing semantics, referred to as

neural machine translation semantic units word pair encoding attentive semantic fusion encoder

发现论文，激发创造

采用子单元的神经机器翻译生僻词

本文提出了一种基于子单词单位的、更简单且更有效的方法来处理翻译中的开放性词汇问题，并通过实验证明了这种方法相较于备用字典模式可以提升该模型的翻译效果。

Aug, 2015

无监督统计机器翻译

本文提出了一种基于 SMT 的新颖方法，通过跨语言嵌入映射从单语料库中诱导短语表，再将其与 N-gram 语言模型相结合，通过无监督超参数微调的变体来实现迭代反向翻译，并在 WMT 2014 中实现了超过 7-10 BLEU 点的改进，与监督 SMT 相比关闭了 2-5 BLEU 点的差距。

Sep, 2018

带有句法感知词表示的句法增强神经机器翻译

本研究提出了一种基于依赖解析器的隐式语法表示方法，通过使用中间隐藏的依赖解析器表示来增强基础神经机器翻译模型，可以在中英文和英越翻译任务的基准数据集上显著提高 BLEU 打分表现，并超过了显式树状 RNN 和线性化方法。

May, 2019

神经机器翻译的不确定性感知语义增强

本文提出了一种新的方式用于神经机器翻译的模型训练，通过对多个具有相同语义的源语言句子进行明确抓取通用的语义信息以提高模型性能。在各类翻译任务的实验中，本方法表现显著优于现有方法。

Oct, 2020

神经机器翻译中语义现象的自然语言推理评估

本文提出一个过程，用于研究神经机器翻译 (NMT) 系统生成的句子表示如何编码不同的语义现象，最终发现编码器最适合在语法 - 语义界面上支持推理，而不是需要世界知识的指代消解。

Apr, 2018

利用语言模型重打分，在无监督机器翻译中加入单词和子词单元

本文讲述了 CAiRE 团队利用基于短语的统计机器翻译模型、预训练语言模型、字节对编码嵌入以及 MUSE 对德语和捷克语进行的非监督机器翻译，同时提出了重新评分机制以及对翻译的预处理和后处理方法以提高最终的翻译质量。

Aug, 2019

神经网络进行机器翻译评估

使用神经网络在配对设置下进行机器翻译评估的框架，以从一对假设中选择更好的翻译为目标。该框架将参考和两个假设的词汇、句法和语义信息嵌入到紧凑的分布式向量表示中，并提供了一个与人类判断相关的 MT 评估度量。

Oct, 2017

搜索引擎引导的非参数神经机器翻译

本研究提出了一种基于注意力机制的神经机器翻译（NMT）模型，并允许它在训练后访问整个平行句子对训练集。该模型由两个阶段组成：检索阶段和翻译阶段，实现了在源句子和一组检索的平行句子对之间的平滑翻译。在三种语言（En-Fr，En-De 和 En-Es）上的实证评估表明，该方法显著优于基准方法，并且当检索到更相关的平行句子对时，改进效果更为显著。

May, 2017

利用语法感知编码器和解码器实现改进的神经机器翻译

本研究致力于改进基于编码器 - 解码器框架的神经机器翻译模型，通过显式地结合源侧语法树，在两种结构化表示（顺序和树）之间进行学习，提出具有树覆盖模型和双向树编码器的翻译模型，并证实优于其他基线模型。

Jul, 2017

一种有效的无监督机器翻译方法

本文针对现有无监督机器翻译存在的不足之处，通过利用子词信息、开发理论上有根据的无监督调优方法和引入联合优化程序等手段，改进了统计机器翻译系统，并将其用于初始化双 NMT 模型并进行后续微调，使无监督机器翻译的表现大幅度提升。在英德无监督机器翻译领域，改进后的 SMT 系统相较之前最好的无监督系统 BLEU 值提高了 5.5 个百分点，超过了当时的（监督）任务获胜者。

Feb, 2019