神经机器翻译的无监督质量评估

May, 2020

Unsupervised Quality Estimation for Neural Machine Translation

Marina Fomicheva, Shuo Sun, Lisa Yankovskaya, Frédéric Blain, Francisco Guzmán...

TL;DR提出了一种无监督方法来进行机器翻译的质量估计，该方法不需要大量专家注释数据、计算和时间来训练。该方法通过从机器翻译系统中提取有用的信息，并采用不确定性量化方法，实现了与人类判断质量的很好相关性，与最先进的监督质量估计模型相媲美。同时，他们还收集了第一个数据集，使得可以进行黑盒和白盒方法的质量估计的工作。

Abstract

quality estimation (QE) is an important component in making machine translation (MT) useful in real-world applications, as it is aimed to inform the user on the quality of the MT output at test time. Existing app

发现论文，激发创造

机器翻译质量估计的实用视角

本研究旨在提高机器翻译句子水平的翻译编辑速率预测，提出了句子水平的质量分类（QC）观点，以优化召回率，并通过二进制分类器的使用可将后编辑工作量减少至50-60％。

May, 2020

跨语言Transformer多语言词级质量评估的探索性分析

本文探讨了以往机器翻译的词汇质量评估模型的局限性，并提出了基于强大的预训练Transformer模型的跨语言通用性的词汇质量评估模型，证明其在跨语言模型训练、零样本/少样本数据归集的情况下，很好地泛化了，并且在实际应用中具有更广泛的应用前景。

May, 2021

不确定性感知的机器翻译评估

本研究介绍了一种基于神经网络度量的机器翻译质量不确定性评估方法，并结合蒙特卡罗dropout和深度集成等两种不确定度估计方法，得出质量分数以及置信区间。通过对来自QT21数据集和WMT20度量任务的多语种数据进行实验，验证了该方法的性能，进一步探讨了不依赖参考文献的不确定性评估在发现可能的翻译错误中的应用。

Sep, 2021

基于不确定性量化增强的神经机器翻译质量评估：超越玻璃盒特征

本文将“玻璃箱质量评估”方法推广到黑箱和玻璃箱方法的不确定性量化，提出了基于预训练的跨语言语言模型的不确定性量化特征工程框架，并在WMT 2020 QE共享任务数据集上取得了最先进的性能。

Sep, 2021

基于分类的质量评估：用于实际应用的小型高效模型

我们研究了句子级机器翻译的质量估计(QE)问题，发现传统的基于回归的方法以及基于压缩模型的方法都不能很好地解决实际应用中的问题，而基于分类的方法可以更好地反映他们在实际应用中的性能表现。

Sep, 2021

推动正确按钮：对质量评估的对抗性评估

该论文提出了一种对机器翻译中的质量评估进行敌对测试的方法，通过研究近期最优设备的评价体系，发现某些含有意义错误的翻译结果是难以被评估系统检测的。同时，该论文还研究了翻译结果保留原本含义和改变原本含义两种扰动的区别，并探讨了这种方法对于评估系统的多个领域可能产生的影响以及评估结果可行性的可比性。

Sep, 2021

针对低资源语言的不匹配感知无监督翻译质量评估

本文提出了一种简单的无监督翻译质量评估方法XLMRScore，该方法基于使用XLM-RoBERTa模型计算的BertScore，并讨论了使用此方法时出现的问题。接着，我们提出两种方法来缓解问题，并将所提出的方法用于四个WMT21 QE shared task中的低资源语言对以及本文介绍的一个新的英语-波斯语测试数据集。实验表明，在两个零-shot场景下，我们的方法可以获得与有监督基线相当的结果，即Pearson相关性差异小于0.01，在所有低资源语言对中的表现均优于无监督对手，平均超过8％。

Jul, 2022

基于扰动的质量评估: 一种可解释的无监督词级别黑盒机器翻译质量评估方法

本研究提出基于扰动的无监督学习方法，用于评估黑盒机器翻译模型的质量，表现出更好的泛化能力和解释性。

May, 2023

没有比更好的数据更好的数据：使用质量度量对MT数据进行过滤

使用质量评估（QE）指标过滤训练数据的句子对可以提高翻译质量并减少训练规模一半。

Nov, 2023

从手工特征到LLMs：机器翻译质量估计的简要调查

机器翻译质量评估（MTQE）是实时估计机器翻译文本质量的任务，不需要参考翻译，对机器翻译的发展非常重要。本文综述了质量评估数据集、标注方法、共享任务、方法学、挑战和未来研究方向。

Mar, 2024