本文介绍了一种利用语义嵌入进行往返翻译的质量估计技术,相较于以往的WMT 2019质量估计任务提交的方法,我们的方法与人类判断之间的相关性最高,且在往返翻译选择上表现鲁棒性较佳。此外,该方法能够针对SMT和NMT等多种类型的前向翻译模型进行一致的性能表现。
Apr, 2020
本研究旨在提高机器翻译句子水平的翻译编辑速率预测,提出了句子水平的质量分类(QC)观点,以优化召回率,并通过二进制分类器的使用可将后编辑工作量减少至50-60%。
May, 2020
提出了一种无监督方法来进行机器翻译的质量估计,该方法不需要大量专家注释数据、计算和时间来训练。该方法通过从机器翻译系统中提取有用的信息,并采用不确定性量化方法,实现了与人类判断质量的很好相关性,与最先进的监督质量估计模型相媲美。同时,他们还收集了第一个数据集,使得可以进行黑盒和白盒方法的质量估计的工作。
本文探讨了以往机器翻译的词汇质量评估模型的局限性,并提出了基于强大的预训练Transformer模型的跨语言通用性的词汇质量评估模型,证明其在跨语言模型训练、零样本/少样本数据归集的情况下,很好地泛化了,并且在实际应用中具有更广泛的应用前景。
May, 2021
为了调整预先训练的质量评估模型的体积,将强质量评估教师模型的知识直接转移到体积更小的模型中,并结合数据增强,得到了具有8倍更少参数的轻量级质量评估模型。
Jul, 2021
使用先进的特征归属方法对最新的品质预估模型进行了探讨,发现训练有素的句子级别品质估测模型可以用于检测翻译错误,并提出了一种新的半监督词级别品质估测方法。该研究还将品质估测任务提出作为一个用于评估特征归属的新基准。
Aug, 2021
该论文提出了一种对机器翻译中的质量评估进行敌对测试的方法,通过研究近期最优设备的评价体系,发现某些含有意义错误的翻译结果是难以被评估系统检测的。同时,该论文还研究了翻译结果保留原本含义和改变原本含义两种扰动的区别,并探讨了这种方法对于评估系统的多个领域可能产生的影响以及评估结果可行性的可比性。
Sep, 2021
本研究提出基于扰动的无监督学习方法,用于评估黑盒机器翻译模型的质量,表现出更好的泛化能力和解释性。
May, 2023
使用质量评估(QE)指标过滤训练数据的句子对可以提高翻译质量并减少训练规模一半。
Nov, 2023
机器翻译质量评估(MTQE)是实时估计机器翻译文本质量的任务,不需要参考翻译,对机器翻译的发展非常重要。本文综述了质量评估数据集、标注方法、共享任务、方法学、挑战和未来研究方向。
Mar, 2024