低资源语言的神经机器翻译

Aug, 2017

Neural machine translation for low-resource languages

Robert Östling, Jörg Tiedemann

TL;DR本文研究通过引入更多本地依赖关系和使用单词对齐来学习翻译过程中的句子重新排序，在低资源语言中使用神经机器翻译(NMT)模型，产生仅使用7万个训练数据令人满意的翻译结果。

Abstract

neural machine translation (NMT) approaches have improved the state of the art in many machine translation settings over the last couple of years, but they require large amounts of training data to produce sensible output. We demonstrate that NMT can be used for →

发现论文，激发创造

面向低资源神经机器翻译的迁移学习

该研究提出了一种转移学习的方法，通过先训练一个高资源语言对以及将一些已学习的参数转移至低资源语言对，来初始化和约束训练，显著提高了Bleu分数，并将低资源机器翻译性能接近于强的基于语法的机器翻译系统，超过了其一个语言对的性能，并且用于重新评分可以进一步提高低资源机器翻译的表现。

Apr, 2016

由统计机器翻译指导的神经机器翻译

本文提出了将SMT模型融入NMT框架，通过辅助分类器和门函数来结合SMT的推荐和NMT的生成，从而提高中英翻译的性能。实验结果表明，该方法在多个测试集上均显著优于现有的NMT和SMT系统。

Oct, 2016

重新审视低资源神经机器翻译：以个案研究为例

本文探讨神经网络机器翻译（NMT）在低资源条件下性能下降的原因，提出适应低资源环境时的注意事项和最佳实践，并在德语-英语和韩语-英语低资源翻译数据集上进行实验，发现经过优化的NMT系统可以在没有使用其他语言辅助数据的情况下，比以前报告的更少数据超越采用词组统计的基于规则的机器翻译（PBSMT），BLEU指标超过4个点。

May, 2019

零资源语言的多语言神经机器翻译

本篇论文介绍了如何使用多语言神经机器翻译（multilingual NMT）解决低资源语种翻译问题，提出了一种基于迭代自训练的方法可以利用单语数据来提高零样本翻译的性能。实验结果表明，多语言NMT优于传统的双语NMT，Transformer模型优于循环神经网络模型，零样本NMT优于传统的基于中间语的翻译方法，甚至与完全训练的双语系统相当。

Sep, 2019

五种非洲语言低资源神经机器翻译基准

研究了最近神经机器翻译 (NMT) 在英语和五种非洲低资源语言 (LRL) 对之间的效果，并表明多语言模型 (multilingual approach) 在某些翻译方向上有 +5 分数的提升。同时，提供标准的实验数据和测试集以供未来的研究使用。

Mar, 2020

低资源语言的神经机器翻译：综述

本文介绍了对低资源语言NMT（LRL-NMT）的研究进展进行了详细调查，并定量分析了最受欢迎的解决方案，提供了一组指南来选择给定LRL数据设置的可能的NMT技术。它还呈现了LRL-NMT研究领域的完整视图，并提供了进一步增强LRL-NMT研究工作的建议清单。

Jun, 2021

低资源神经机器翻译调查

本文对低资源神经机器翻译进行了调查，并根据所使用的辅助数据将相关作品分为三类：利用源语言和/或目标语言的单语数据，利用来自辅助语言的数据以及利用多模态数据。该调查有助于研究人员更好地理解该领域，鼓励他们设计更好的算法，也有助于帮助行业从业者选择适合其应用程序的算法。

Jul, 2021

基于经典SMT视角的NMT训练过程：语言建模、词汇翻译、排序

通过研究 NMT 模型训练过程中的能力表现，发现其在学习目标语言模型、逐词翻译和复杂重排序模式方面的能力表现与传统的 SMT 模型有明显差异，并探讨了这种理解对于优化 NMT 模型的实际应用。

Sep, 2021

低资源语言的神经机器翻译

该研究探索了低资源语言领域的神经机器翻译以及如何通过NLP和深度学习技术对语言模型进行改进

Apr, 2023

在印度尼西亚的低资源本地语言上复制性评测神经机器翻译(NMT)

通过对印尼四种资源匮乏的本土语言：爪哇语、巽他语、民丹·卡巴乌语和巴厘语的神经机器翻译系统进行全面分析，本研究揭示了适用于资源匮乏语言翻译的实用策略，展示了实现竞争性翻译品质的神经机器翻译系统，对类似背景的研究者提供了有价值的指导。

Nov, 2023