低频语种翻译的三角形架构

ACLMay, 2018

Triangular Architecture for Rare Language Translation

Shuo Ren, Wenhu Chen, Shujie Liu, Mu Li, Ming Zhou...

TL;DR提出了一种三角训练结构（TA-NMT），通过利用双语数据以及中间语言的翻译模型联合优化，实现了稀有语言低资源翻译的质量提升，并通过反向翻译进一步提升性能。

Abstract

neural machine translation (NMT) performs poor on the low-resource language pair $(X,Z)$, especially when $Z$ is a rare language. By introducing another rich language $Y$, we propose a novel triangular training architec

neural machine translation triangular training architecture low-resource languages bilingual data back-translation

发现论文，激发创造

双向神经机器翻译与合成平行数据

本论文提出一种结合了回译和多语言神经机器翻译技术的新技术，通过为一个语言对训练一个模型来改善在低资源和跨领域情况下的机器翻译效果，并且能显著降低培训和部署成本。

May, 2018

构建可提供任意 X-Y 翻译的多语言机器翻译系统

本文旨在讨论如何通过两阶段训练策略实现多语言神经机器翻译系统，以解决低效率的问题，并在 WMT'21 多语言翻译任务中进行实验验证，证明我们的系统在大多数方向上优于基线模型，并且不需要架构修改或额外数据收集。

Jun, 2022

改进大规模多语言神经机器翻译和零样例翻译

本文探讨了如何改善大规模多语言神经机器翻译模型的性能，并提出了加强模型能力、引入语言特定组件和加深神经机器翻译结构以支持具有不同类型学特征的语言对，同时通过随机在线回译来解决离线训练中未出现的语言对翻译问题。实验结果表明，本方法在一对多和多对多设置中缩小了双语模型的性能差距，并将零 - shot 表现提高约 10 BLEU，接近传统的基于中间语言的方法。

Apr, 2020

零资源语言的多语言神经机器翻译

本篇论文介绍了如何使用多语言神经机器翻译（multilingual NMT）解决低资源语种翻译问题，提出了一种基于迭代自训练的方法可以利用单语数据来提高零样本翻译的性能。实验结果表明，多语言 NMT 优于传统的双语 NMT，Transformer 模型优于循环神经网络模型，零样本 NMT 优于传统的基于中间语的翻译方法，甚至与完全训练的双语系统相当。

Sep, 2019

低资源语言的神经机器翻译

本文研究通过引入更多本地依赖关系和使用单词对齐来学习翻译过程中的句子重新排序，在低资源语言中使用神经机器翻译 (NMT) 模型，产生仅使用 7 万个训练数据令人满意的翻译结果。

Aug, 2017

零资源神经机器翻译的教师 - 学生框架

本文提出了一种基于零资源的神经机器翻译方法，该方法假设平行句子在第三种语言中生成的可能性相近，借助于一种现有的基于枢轴语言的 NMT 模型进行指导，在没有平行语料库的情况下训练源语言到目标语言的 NMT 模型。实验结果表明，该方法在各种语言对上能够显著提高 BLEU 值 3.0 点以上。

May, 2017

利用单语数据进行神经机器翻译模型的联合训练

本文提出了一种新方法，通过联合 EM 优化方法融合源语言和目标语言的神经机器翻译模型，以更好地利用单语数据来提高翻译质量，实验结果表明，相对于使用单语数据训练的强基线系统，该方法可以同时提高源到目标和目标到源模型的翻译质量。

Mar, 2018

跨语言监督提高无监督神经机器翻译

本研究提出了一种跨语言无监督神经机器翻译框架，利用来自高资源语言对的弱监督信号，以提高零资源翻译质量。该框架基于多语言模型，不需要对标准无监督神经机器翻译进行改动，实验结果表明使用该框架可以在六个基准无监督翻译方向上将翻译质量提高超过 3 个 BLEU 分数。

Apr, 2020

零样本神经机器翻译中的缺失元素

本文研究了多语言神经机器翻译模型的零样本翻译问题，提出了基于辅助损失的方法，并在 WMT14 英语 - 法语 / 德语上实现了与基于中介语的模型相媲美的零样本翻译效果，同时在 IWSLT 2017 共享任务中验证了该方法的易于扩展性。

Mar, 2019

基于多智能体通信协作的零资源神经机器翻译算法

本文提出了一种交互式多模态框架，通过游戏的方式解决了低资源语言对和领域下数据匮乏的翻译问题，并在实验中证明此学习机制显著优于现有的最先进方法。

Feb, 2018