基于相关性引导的神经机器翻译

Nov, 2023

Relevance-guided Neural Machine Translation

Isidora Chara Tourni, Derry Wijaya

TL;DR我们提出了一种基于可解释性的 NMT 训练方法，应用于无监督和有监督模型训练，用于翻译英语和三种不同资源的语言 —— 法语、古吉拉特语和哈萨克语。我们的结果表明，我们的方法在低资源条件下可以有希望，优于简单的训练基线；尽管改进只是微小的，但为进一步探索这种方法和参数以及其扩展到其他语言奠定了基础。

Abstract

With the advent of the transformer architecture, neural machine translation (NMT) results have shown great improvement lately. However, results in →

transformer architecture neural machine translation low-resource conditions data scarcity explainability-based training

发现论文，激发创造

低资源语言的神经机器翻译

本文研究通过引入更多本地依赖关系和使用单词对齐来学习翻译过程中的句子重新排序，在低资源语言中使用神经机器翻译 (NMT) 模型，产生仅使用 7 万个训练数据令人满意的翻译结果。

Aug, 2017

零资源语言的多语言神经机器翻译

本篇论文介绍了如何使用多语言神经机器翻译（multilingual NMT）解决低资源语种翻译问题，提出了一种基于迭代自训练的方法可以利用单语数据来提高零样本翻译的性能。实验结果表明，多语言 NMT 优于传统的双语 NMT，Transformer 模型优于循环神经网络模型，零样本 NMT 优于传统的基于中间语的翻译方法，甚至与完全训练的双语系统相当。

Sep, 2019

跨语言监督提高无监督神经机器翻译

本研究提出了一种跨语言无监督神经机器翻译框架，利用来自高资源语言对的弱监督信号，以提高零资源翻译质量。该框架基于多语言模型，不需要对标准无监督神经机器翻译进行改动，实验结果表明使用该框架可以在六个基准无监督翻译方向上将翻译质量提高超过 3 个 BLEU 分数。

Apr, 2020

无监督神经机器翻译的实证研究：NMT 输出、模型行为和句子贡献的分析

无监督神经机器翻译（UNMT）关注于提高无人翻译平行数据的 NMT 结果，但在突出其优势与分析除翻译准确性以外的输出方面，迄今为止还做得很少。我们聚焦于三种非常不同的语言，法语、古吉拉特语和哈萨克语，并使用不同程度的监督来训练双语 NMT 模型，并在高和低资源环境中，测量 NMT 输出的质量，并将生成的序列的词序和语义相似性与源语句和参考句子进行比较。我们还使用分层相关传播来评估源语句和目标语句对结果的贡献，并扩展了先前作品对 UNMT 范式的发现。

Dec, 2023

低资源神经机器翻译调查

本文对低资源神经机器翻译进行了调查，并根据所使用的辅助数据将相关作品分为三类：利用源语言和 / 或目标语言的单语数据，利用来自辅助语言的数据以及利用多模态数据。该调查有助于研究人员更好地理解该领域，鼓励他们设计更好的算法，也有助于帮助行业从业者选择适合其应用程序的算法。

Jul, 2021

低资源语言的神经机器翻译

该研究探索了低资源语言领域的神经机器翻译以及如何通过 NLP 和深度学习技术对语言模型进行改进

Apr, 2023

重新审视低资源神经机器翻译：以个案研究为例

本文探讨神经网络机器翻译（NMT）在低资源条件下性能下降的原因，提出适应低资源环境时的注意事项和最佳实践，并在德语 - 英语和韩语 - 英语低资源翻译数据集上进行实验，发现经过优化的 NMT 系统可以在没有使用其他语言辅助数据的情况下，比以前报告的更少数据超越采用词组统计的基于规则的机器翻译（PBSMT），BLEU 指标超过 4 个点。

May, 2019

增强低资源语言的神经机器翻译：语料库开发、人工评估和可解释 AI 架构

该研究旨在研究机器翻译中 Transformer 模型在低资源语言对（英爱尔兰语和英马拉地语）中的效果，并通过优化超参数和子词模型类型来显著提高低资源语言对的翻译质量。此外，还引入了 adaptNMT 和 adaptMLLM 两个开源应用程序，简化了神经机器翻译模型的开发、微调和部署过程，使其更容易被开发人员和翻译人员使用。

Mar, 2024

谷歌的神经机器翻译系统：弥合人类翻译和机器翻译之间的差距

Google 发布的 GNMT 神经机器翻译系统采用 LSTM 深度学习网络，使用 attention 机制和残差连接，借助词元素 (wordpieces) 将单词划分为子单元，提高了稀有单词处理能力与整体系统精度。

Sep, 2016

无监督神经机器翻译

本研究提出了一种全新的方法，在没有平行数据的情况下，只利用单语数据即可训练 NMT 系统。这种基于注意力机制的编码器解码器模型结合去噪和回译技术，在 WMT 2014 的法英和德英翻译中获得了 15.56 和 10.21 BLEU 分数，且能够利用少量的平行数据来提高翻译质量。

Oct, 2017