低资源神经机器翻译调查

Jul, 2021

A Survey on Low-Resource Neural Machine Translation

Rui Wang, Xu Tan, Renqian Luo, Tao Qin, Tie-Yan Liu

TL;DR本文对低资源神经机器翻译进行了调查，并根据所使用的辅助数据将相关作品分为三类：利用源语言和/或目标语言的单语数据，利用来自辅助语言的数据以及利用多模态数据。该调查有助于研究人员更好地理解该领域，鼓励他们设计更好的算法，也有助于帮助行业从业者选择适合其应用程序的算法。

Abstract

Neural approaches have achieved state-of-the-art accuracy on machine translation but suffer from the high cost of collecting large scale parallel data. Thus, a lot of research has been conducted for neural machine translation (NMT) with very limited parallel data, i.e., the

发现论文，激发创造

低资源语言的神经机器翻译

本文研究通过引入更多本地依赖关系和使用单词对齐来学习翻译过程中的句子重新排序，在低资源语言中使用神经机器翻译(NMT)模型，产生仅使用7万个训练数据令人满意的翻译结果。

Aug, 2017

低资源神经机器翻译元学习

本文利用元学习算法(MAML)扩展低资源NMT问题，并通过多语言高资源任务进行学习来适应低资源语言，并利用全局词汇表解决不同语言的输入输出错配，在使用18种欧洲语言作为源任务和5种不同的语言作为目标任务的情况下，相对于基于多语言、迁移学习的方法，表明所提出的方法显著优于现有方法，并仅需少量训练示例即可获得具有竞争力的NMT系统。

Aug, 2018

重新审视低资源神经机器翻译：以个案研究为例

本文探讨神经网络机器翻译（NMT）在低资源条件下性能下降的原因，提出适应低资源环境时的注意事项和最佳实践，并在德语-英语和韩语-英语低资源翻译数据集上进行实验，发现经过优化的NMT系统可以在没有使用其他语言辅助数据的情况下，比以前报告的更少数据超越采用词组统计的基于规则的机器翻译（PBSMT），BLEU指标超过4个点。

May, 2019

低资源机器翻译中的语法差异处理

本文提出一种简单但有效的方法，即将目标语句重新排序以匹配源语序，并将其作为另外一种训练时的监督信号，从而在模拟低资源日语 - 英语和真实低资源维吾尔 - 英语语种中获得显着改进。

Aug, 2019

五种非洲语言低资源神经机器翻译基准

研究了最近神经机器翻译 (NMT) 在英语和五种非洲低资源语言 (LRL) 对之间的效果，并表明多语言模型 (multilingual approach) 在某些翻译方向上有 +5 分数的提升。同时，提供标准的实验数据和测试集以供未来的研究使用。

Mar, 2020

关于低资源语言翻译的最优Transformer深度

本研究对Transformer模型在低资源语言翻译中的应用进行了探究，发现过度追求模型大小存在负面影响，需要注意调整超参数以提高性能。同时，本研究旨在挖掘更佳的模型性能，以推动“Masakhane”项目的发展。

Apr, 2020

低资源语言的神经机器翻译：综述

本文介绍了对低资源语言NMT（LRL-NMT）的研究进展进行了详细调查，并定量分析了最受欢迎的解决方案，提供了一组指南来选择给定LRL数据设置的可能的NMT技术。它还呈现了LRL-NMT研究领域的完整视图，并提供了进一步增强LRL-NMT研究工作的建议清单。

Jun, 2021

低资源语言的神经机器翻译

该研究探索了低资源语言领域的神经机器翻译以及如何通过NLP和深度学习技术对语言模型进行改进

Apr, 2023

在印度尼西亚的低资源本地语言上复制性评测神经机器翻译(NMT)

通过对印尼四种资源匮乏的本土语言：爪哇语、巽他语、民丹·卡巴乌语和巴厘语的神经机器翻译系统进行全面分析，本研究揭示了适用于资源匮乏语言翻译的实用策略，展示了实现竞争性翻译品质的神经机器翻译系统，对类似背景的研究者提供了有价值的指导。

Nov, 2023

探索神经机器翻译用于低资源语言：以巴伐利亚语为案例研究

机器翻译在高资源语言取得了接近人类水平的成绩，但低资源语言的研究表明并非所有语言都能从多语言系统中受益。本文通过应用神经机器翻译技术，研究了德语和巴伐利亚语之间的自动翻译系统，并针对低资源语言的困难提出了创新的解决方案，如利用语言相似性和后向翻译等方法来改进翻译性能。

Apr, 2024