评估阿塞拜疆语神经机器翻译

Jul, 2022

Benchmarking Azerbaijani Neural Machine Translation

Chih-Chen Chen, William Chen

TL;DR本研究对使用不同技术和数据集的阿塞拜疆语 - 英语 NMT 系统进行表现基准测试，并评估哪种分段技术在阿塞拜疆语翻译中效果最佳。结果显示，虽然 Unigram 分割可以提高 NMT 性能，而且阿塞拜疆语翻译模型随着数据集质量而不是数量的提高而具有更好的规模性，但跨域泛化仍然是一个挑战。

Abstract

Little research has been done on neural machine translation (NMT) for azerbaijani. In this paper, we benchmark the performance of azerbaijani

neural machine translation azerbaijani segmentation techniques nmt models cross-domain generalization

发现论文，激发创造

突厥语言机器翻译的大规模研究

本文是大规模实际应用机器翻译于突厥语系的案例研究，在高、低资源场景下使用平行语料库、双语基准和人工评估结果来识别瓶颈，并提供这些数据与模型的公开开放。

Sep, 2021

基于相关性引导的神经机器翻译

我们提出了一种基于可解释性的 NMT 训练方法，应用于无监督和有监督模型训练，用于翻译英语和三种不同资源的语言 —— 法语、古吉拉特语和哈萨克语。我们的结果表明，我们的方法在低资源条件下可以有希望，优于简单的训练基线；尽管改进只是微小的，但为进一步探索这种方法和参数以及其扩展到其他语言奠定了基础。

Nov, 2023

评估土耳其语系多语言多向 NMT 技术

本研究通过对土耳其语系 22 种语言的大规模机器翻译系统的培训和评估，发现 MNMT 模型在领域外测试集中的表现优于几乎所有双语基线，并在单对下游任务的微调中也获得了巨大的性能提升。

Sep, 2021

神经机器翻译：综述与调查

本文追溯了现代神经机器翻译体系结构的起源，重点探讨了单个神经网络在翻译中的应用，其中涉及到 word 和 sentence embedding 以及编码器 - 解码器网络家族的早期示例，并总结了该领域的最新趋势。

Dec, 2019

在印度尼西亚的低资源本地语言上复制性评测神经机器翻译 (NMT)

通过对印尼四种资源匮乏的本土语言：爪哇语、巽他语、民丹・卡巴乌语和巴厘语的神经机器翻译系统进行全面分析，本研究揭示了适用于资源匮乏语言翻译的实用策略，展示了实现竞争性翻译品质的神经机器翻译系统，对类似背景的研究者提供了有价值的指导。

Nov, 2023

谷歌的神经机器翻译系统：弥合人类翻译和机器翻译之间的差距

Google 发布的 GNMT 神经机器翻译系统采用 LSTM 深度学习网络，使用 attention 机制和残差连接，借助词元素 (wordpieces) 将单词划分为子单元，提高了稀有单词处理能力与整体系统精度。

Sep, 2016

低资源语言的神经机器翻译

本文研究通过引入更多本地依赖关系和使用单词对齐来学习翻译过程中的句子重新排序，在低资源语言中使用神经机器翻译 (NMT) 模型，产生仅使用 7 万个训练数据令人满意的翻译结果。

Aug, 2017

野外大规模多语言神经机器翻译：发现与挑战

我们致力于构建一款通用的神经机器翻译系统，通过构建一个单一的大规模多语言 NMT 模型，实现了 103 种语言之间的翻译，带有有效的迁移学习能力，显着提高了低资源语言的翻译质量，同时保持高资源语言翻译质量与竞争双语基线相当，为实现通用 NMT 模型的质量和实用性提供了多个方面的模型构建分析，并指出未来研究的方向和需进一步解决的问题。

Jul, 2019

阿拉伯语神经机器翻译的首个结果

本文应用神经机器翻译技术在阿拉伯语翻译任务中进行比较和预处理，并发现在处理适当的阿拉伯语脚本前，神经机器翻译和基于短语的翻译系统性能相近，但神经机器翻译在域外测试集上明显优于短语翻译系统，在实际应用中更具吸引力。

Jun, 2016

评估大规模多语言神经机器翻译的跨语种有效性

本文评估了一个大规模多语言神经机器翻译模型编码器在五个跨语言分类和序列标记任务中的跨语言效果，并展示了零 - shot 转移学习中在四个任务中的增益。

Sep, 2019