文档级神经机器翻译：方法与评估调查

Dec, 2019

文档级神经机器翻译：方法与评估调查

A Survey on Document-level Neural Machine Translation: Methods and Evaluation

Sameen Maruf, Fahimeh Saleh, Gholamreza Haffari

TL;DR这篇综述论文旨在总结文档级机器翻译的最新研究进展，重点讨论了神经网络模型、训练策略、评估指标等方面的创新，为该领域的研究者提供状态认知和未来方向。

Abstract

machine translation (MT) is an important task in natural language processing (NLP) as it automates the translation process and reduces the reliance on human translators. With the resurgence of neural networks, th

machine translation neural networks document-level modelling evaluation strategies

发现论文，激发创造

神经机器翻译：综述与调查

本文追溯了现代神经机器翻译体系结构的起源，重点探讨了单个神经网络在翻译中的应用，其中涉及到 word 和 sentence embedding 以及编码器 - 解码器网络家族的早期示例，并总结了该领域的最新趋势。

Dec, 2019

机器翻译评估概述

自 20 世纪 50 年代以来，机器翻译 (MT) 已成为人工智能和开发的重要任务之一，并经历了几个不同阶段的发展，随着这些发展，评估方法在统计翻译和神经翻译研究中扮演着重要角色，该报告概述了评估方法的发展历程、研究方法分类和最新进展，并包括参考翻译的手动评估和自动评估方法。

Feb, 2022

论文档级神经机器翻译的搜索策略

本文研究如何利用上下文感知的翻译模型在解码时最佳应用。通过对比使用标准自动指标和三个标准的文档级翻译基准测试上的特定语言现象，我们发现大多数常用的解码策略表现相似，并且更高质量的上下文信息有潜力进一步改善翻译效果。

Jun, 2023

神经机器翻译深度学习技术综述

这份文献调查追溯了神经机器翻译的起源和主要发展时间线，探究了重要的分支，对不同的研究方向进行分类，并讨论了该领域的一些未来研究趋势。

Feb, 2020

深入探究上下文感知神经机器翻译

本文研究了文档级 NMT 模型在四个不同领域中的性能，并发现不同的架构适用于不同的任务，同时发现上下文感知系统在任务特定问题上有改进，而文本级别的指标（如 BLEU）没有显着改进。同时，本文还表明，文档级别的回译对于缺乏文档级别双文本的情况有很大的帮助。

Oct, 2020

使用自我训练在句子级神经机器翻译模型中捕获文档上下文

该研究提出了一种基于自训练的方法，可以在不需要专门的并行文档级语料库和模型的情况下，将已训练好的句子级神经机器翻译模型应用于文档级机器翻译任务，并在三个文档级数据集上进行了评估，结果显示我们的方法在 BLEU 指标上具有更高的得分和更高的人类偏好度。

Mar, 2020

多语言神经机器翻译综述

本文旨在介绍多语言神经网络机器翻译（MNMT）的概述，重点关注其经验转移的传输学习方法，对相关研究领域、建模原理和挑战进行了细致分类，讨论了不同技术的优劣，并探讨了未来的研究方向。

Jan, 2020

文档级机器翻译方法比较

本文给出了关于文档级机器翻译的文献综述，对比了各种方法在两个文档级评估套件上的表现，并发现基于单语文档的回译方法在文档级评估和人类评估方面都能达到相同结果，因此不需要设计过于复杂的模型。

Jan, 2021

面向个性化及文档级对话机器翻译

Personalised NMT and document-level NMT are proposed to incorporate extra-textual information directly into the machine translation process, with the aim of improving the accuracy of translation for subtitles in five languages, respectively. The main challenges are addressed by incorporating extra-textual information, improving the accuracy of cohesion devices, and proposing reliable evaluation metrics for PersNMT and DocNMT.

Feb, 2021

谷歌的神经机器翻译系统：弥合人类翻译和机器翻译之间的差距

Google 发布的 GNMT 神经机器翻译系统采用 LSTM 深度学习网络，使用 attention 机制和残差连接，借助词元素 (wordpieces) 将单词划分为子单元，提高了稀有单词处理能力与整体系统精度。

Sep, 2016