来自非母语者的文本的神经机器翻译

Aug, 2018

来自非母语者的文本的神经机器翻译

Neural Machine Translation of Text from Non-Native Speakers

Alison Lui, Antonios Anastasopoulos, David Chiang

TL;DR本研究研究神经机器翻译系统中的数据噪声问题以及如何通过增加包含人工引入的语法错误句子的训练数据来提高其对错误的鲁棒性，同时提出了一套用于测试神经机器翻译在处理语法错误上的JFLEG语法纠错语料库的西班牙语翻译。

Abstract

neural machine translation (NMT) systems are known to degrade when confronted with noisy data, especially when the system is trained only on clean data. In this paper, we show that augmenting →

发现论文，激发创造

神经网络翻译模型用于语法纠错

本文介绍了使用神经网络全局词汇模型和神经网络联合模型来改善基于短语的统计机器翻译系统的局限性，通过对源句子的环境信息进行更有效地利用，显著提高了语法错误纠正的准确性。

Jun, 2016

低资源语言的神经机器翻译

本文研究通过引入更多本地依赖关系和使用单词对齐来学习翻译过程中的句子重新排序，在低资源语言中使用神经机器翻译(NMT)模型，产生仅使用7万个训练数据令人满意的翻译结果。

Aug, 2017

将神经语法错误纠正作为低资源机器翻译任务进行处理

该论文提出了一套适用于大多数语法错误修正（GEC）环境的模型无关方法，包括添加源端噪音，领域自适应技术，GEC特定训练目标，单语数据的迁移学习以及集成独立训练的GEC模型和语言模型。这些方法的综合效果导致比现有最优神经GEC模型更好的表现，表现优于CoNLL-2014基准测试中以前最好的神经GEC系统超过10％M2，以及JFLEG测试集中的5.9％。

Apr, 2018

构建强韧的神经机器翻译系统

本文提出采用对抗性稳定性训练来提高神经机器翻译(NMT)模型的鲁棒性，通过使编码器和解码器在输入和其扰动版本的情况下行为相似，进而提高模型的容错性。在汉英、英德和英法翻译任务中的实验结果表明，该方法不仅可以显著提高强NMT系统的翻译品质，而且可以增强NMT模型的鲁棒性。

May, 2018

通过数据增强提高神经机器翻译的鲁棒性：超越回译

本文探讨了神经机器翻译以及如何提高其对于噪声输入的鲁棒性，提出了新的数据扩充方法以及通过利用外部数据中的噪声来加强模型鲁棒性。

Oct, 2019

干净与嘈杂语音转录的强健神经机器翻译

本文研究如何使强NMT系统适应典型ASR错误，并提出适应策略以训练单一系统，能够在无监督输入类型的情况下翻译干净或嘈杂的输入。通过公共演讲翻译数据集的实验结果表明，对包括ASR转录本的大量并行数据进行调整对于相同类型的测试数据是有益的，但在翻译干净文本时会产生轻微恶化。在干净和嘈杂数据的同一数据上进行调整可以在两种输入类型上产生最佳结果。

Oct, 2019

神经机器翻译对输入扰动的鲁棒性评估

本文提出了衡量NMT模型抗干扰性能的一些额外指标，并针对一类使用子单词规范化方法的模型进行了广泛评估，结果表明我们提出的指标揭示了使用子单词规范化方法时抗干扰性能提高的明显趋势。

May, 2020

神经机器翻译与错误校正

本文提出了一种将错误校正机制引入神经机器翻译中的方法，通过使用两个流的自注意力机制，在保证预测下一个标记的同时，对前一个标记的错误信息进行更正，使用预测偏差模拟训练，并在多个数据集上进行了实验验证，证明了其在提高翻译质量方面的有效性。

Jul, 2020

神经机器翻译鲁棒性的句子边界增强

本文针对信息输入过程中产生的错误，并基于错误分析提出了一种简单的数据增强策略，以提高神经机器翻译系统中句子边界分割的鲁棒性。

Oct, 2020

解决神经机器翻译在输入扰动中的漏洞

本文提出了一种通过Context-Enhanced Reconstruction（CER）方法提高神经机器翻译（NMT）在噪音输入下的稳健性的方法，该方法包括通过引入人造干扰词破坏自然性来抵制噪声，并通过提供更好的上下文表示来防止噪声传播。在中英文翻译和法英文翻译任务上的实验证明本方法能够提高新闻和社交媒体文本的稳健性，并且在社交媒体文本上的进一步微调实验表明该方法可以收敛到更高的位置并提供更好的适应性。

Apr, 2021