文档级神经机器翻译的话语衔接评估

Aug, 2022

文档级神经机器翻译的话语衔接评估

Discourse Cohesion Evaluation for Document-Level Neural Machine Translation

Xin Tan, Longyin Zhang, Guodong Zhou

TL;DR该研究提出了一种文档的连贯性评估方法（DCoEM），在考虑了四种连贯方式（参考，连词，替换和词汇连贯）的情况下，为测量文档翻译的连贯性做出贡献，并通过最近的文档级 NMT 系统的评估结果表明我们的方法在评估文档级翻译方面是实用和必要的。

Abstract

It is well known that translations generated by an excellent document-level neural machine translation (NMT) model are consistent and coherent. However, existing sentence-level evaluation metrics like BLEU can hardly reflect the model's performance at the document level. To tackle this issue, we propose a →

document-level neural machine translation discourse cohesion evaluation method test suite cohesive manners document translations

发现论文，激发创造

利用话语奖励进行文档级神经机器翻译

本文提出了一种基于强化学习目标的训练方法，明确优化词汇凝聚力和连贯性两个学术界公认的话语质量指标，实现了在不牺牲翻译忠实度的前提下，比其他竞争性方法更有效地提高了多语种、多领域文档翻译的凝聚和连贯性。在中英语言对中，词汇凝聚力和连贯性分别提高了 2.46 和 1.17 个百分点，BLEU 分数和 F_BERT 分数分别提高了 0.63 和 0.47 个百分点。

Oct, 2020

神经机器翻译中的语篇现象评估

研究了利用上下文进行神经机器翻译的模型，并提出了一种多编码器并解码两个句子以实现上下文输出的方法，该方法在指代和连贯性方面表现最佳。

Nov, 2017

论述性神经机器翻译的连贯性建模

本研究提出一种使用话语上下文和奖励机制来从话语角度提高翻译质量的模型，能够有效提高翻译质量和话语连贯性。

Nov, 2018

通过密集注释的平行语料库以话语为中心评估机器翻译

本论文提出了一个带有丰富语篇注释的新数据集，并探讨了源语言和目标语言的语篇结构相似性和差异性以及其对机器翻译的挑战和机会，该资源可公开使用以促进未来在文档级机器翻译和其他语言翻译任务的研究。

May, 2023

一种用于连贯性建模的多任务学习方法

本研究提出一种层次神经网络模型，通过多任务学习，同时预测文档层次的信息连贯得分和词级别的语法角色，利用两个任务之间的归纳转移，提高模型泛化能力，并在不同任务中达到了新的最优表现。

Jul, 2019

动态主题缓存神经机器翻译一致性建模

提出了一种基于缓存的方法来对神经机器翻译中的一致性进行建模，并采用一个新的层次来计算缓存中的目标词的分数，实验结果表明，所提出的基于缓存的神经模型相对于几种最先进的 SMT 和 NMT 基线的翻译性能都有了显著的提高。

Nov, 2017

上下文化主题一致性度量

本研究提出了一种基于 LLM 的方法，受到人类主题评估的启发，实现了语境化主题连贯性（CTC）度量，其在自动化主题连贯性方法方面表现出色，可应用于短文本，并不容易受到高分却无意义的主题干扰。

May, 2023

BlonDe：一种用于文档级机器翻译的自动评估指标

本文提出了一种新型的自动评估方法 BlonDe，通过将话语连贯性考虑在内来扩大自动翻译评估的范围，从句子级别提高到文档级别，该方法能够更好地区分文档级别的翻译质量改进和句子级别的改进，并且具有更好的判别性、可解释性和敏感性。在大规模的人类研究中，BlonDe 也成功地取得了比前期评估指标更高的 Pearson r 相关度。

Mar, 2021

朝向连贯且凝聚的长文本生成

本文提出了一种新的神经语言模型，它具备两个神经鉴别器，可以在句子层面（内聚性）和段落层面（连贯性）提供反馈信号，并且使用了一种称为负关键序列训练的简单而有效的策略梯度方法进行训练。结果表明，相对于基线（基于双向 MLE 训练的复发关注神经语言模型），我们的方法有效改善了模型表现。

Nov, 2018

上下文感知机器翻译在指代、省略和词汇凝聚方面的改进

本文通过人类实验和模型构建等研究方法，提出了一种适用于大规模句子级平行数据的上下文感知 NMT 模型，通过解决上下文因素引发的翻译不一致问题，取得了 BLEU 上的显著性能提升。

May, 2019