- 对比学习的多语言表征蒸馏
该研究加入对比学习以蒸馏多语言表示,并用于平行语句的质量估计。实验证明,该方法在不同的资源稀少语言上显著优于先前的句子编码器,诸如 LASER 等。
- QUAK:一份用于韩英神经机器翻译的合成质量估计数据集
本文提出 QUAK, 是一个自动生成的合成 QE 数据集(包括三个子数据集),可用于提高机器翻译输出质量的自动预测。该数据集是通过三种相对自由的生成策略产生的,具有良好的可扩展性,已扩展到 1.58M 到 6.58M。对数据集进行统计分析后 - 机器翻译评估中的双向翻译再思考
本文探讨了如何在低资源情况下进行自动评估翻译,并提出使用往返翻译(round-trip translation)技术进行无参考自动评估的方法。我们发现,修改翻译模型中的复制机制可以使这种评估方法更准确。此外,我们还证明,往返翻译可以在多种机 - CometKiwi: IST-Unbabel 2022 提交的质量估计共享任务
本文介绍了我们团队在 WMT 2022 共享任务中的质量估计(QE)的三个子任务中所取得的最佳结果,其中我们应用了 COMET 框架,并将其与 OpenKiwi 的预测器 - 评估器架构相结合,并配备了一个单词级序列标注器和一个解释提取器。
- 重新思考基于人工判断的机器翻译单词质量评估
该论文旨在通过自监督的预训练方法以及标记修正策略,提高机器翻译的质量估计,避免传统质量评价准则的局限性,并通过人类专家的直接评注来构建不需要参考文献的数据集 HJQE 的实验结果证实了我们的方法的有效性。
- EMNLPPreQuEL:机器翻译输出的预测质量评估
PreQuEL 任务可以预测一句话的翻译质量,通过对输入文本的语言特性进行追踪,发现语言特性可以影响机器翻译的难度,数据增强方法可以显著提高预测和质量评估的表现。
- ACL低资源语料挖掘的更好质量估计
提出一种使用多任务训练、数据增强和对比学习相结合的方法,从而提高质量估计模型在现实应用中的鲁棒性,并在 Parallel Corpus Mining 样本集上进行了测试,结果表明该方法的效果比现有方法要好很多,在 PCM 精度上提高了超过 - ACL尽可能少,尽可能多:使用对比调节检测过度翻译和欠翻译
本篇研究提出了一种用于检测神经机器翻译中内容省略和添加现象的方法,并使用对比学习比较翻译模型下完整序列的可能性和其部分的可能性,精确定位翻译中多余的词和源文本中未翻译的词,其准确性与需要自定义质量估计模型的监督方法相当。
- 构建日语语法错误修正自动评估质量估计数据集
本研究针对日本语言的语法错误校正,通过构建手动评估的数据集,建立了自动评估模型,并进行了元评估以验证该数据集的实用性。
- EMNLP推动正确按钮:对质量评估的对抗性评估
该论文提出了一种对机器翻译中的质量评估进行敌对测试的方法,通过研究近期最优设备的评价体系,发现某些含有意义错误的翻译结果是难以被评估系统检测的。同时,该论文还研究了翻译结果保留原本含义和改变原本含义两种扰动的区别,并探讨了这种方法对于评估系 - EMNLP基于分类的质量评估:用于实际应用的小型高效模型
我们研究了句子级机器翻译的质量估计 (QE) 问题,发现传统的基于回归的方法以及基于压缩模型的方法都不能很好地解决实际应用中的问题,而基于分类的方法可以更好地反映他们在实际应用中的性能表现。
- EMNLP基于不确定性量化增强的神经机器翻译质量评估:超越玻璃盒特征
本文将 “玻璃箱质量评估” 方法推广到黑箱和玻璃箱方法的不确定性量化,提出了基于预训练的跨语言语言模型的不确定性量化特征工程框架,并在 WMT 2020 QE 共享任务数据集上取得了最先进的性能。
- 作为基础提取的翻译错误检测
使用先进的特征归属方法对最新的品质预估模型进行了探讨,发现训练有素的句子级别品质估测模型可以用于检测翻译错误,并提出了一种新的半监督词级别品质估测方法。该研究还将品质估测任务提出作为一个用于评估特征归属的新基准。
- ACLCherokee-English 机器翻译演示:质量估计和纠错反馈
文章介绍了 ChrEnTranslate,一个在线机器翻译演示系统,支持英语和濒危语言切罗基之间的翻译,它提供了质量估计、用户反馈界面、示例输入、单词对齐以及相关术语。它还分析了 216 个专家反馈,并发现 NMT 优于 SMT。同时,人类 - ACL知识蒸馏用于质量评估
为了调整预先训练的质量评估模型的体积,将强质量评估教师模型的知识直接转移到体积更小的模型中,并结合数据增强,得到了具有 8 倍更少参数的轻量级质量评估模型。
- ACLIntelliCAT: 搭载质量评估和翻译建议的智能机器翻译后编辑
本文介绍了一种基于智能模型的交互式翻译界面 IntelliCAT,该界面利用两个不同粒度的质量估计模型来实现机器翻译的后编辑过程,进一步提出了一种新的翻译建议模型,能够根据上下文条件性地提供特定单词或短语的替代方案,最终可以自动地保留原始文 - ACL无人工标注数据的质量估计
本文提出了一种基于综合训练数据的方法,用于无需人工参与而进行机器翻译的质量评估,其在句子和单词级别预测上的性能与基于人工标注的数据训练的模型相当。
- 广义 Focal Loss:学习密集物体检测的合格和分布式边界框
本篇论文提出了一种基于 Generalized Focal Loss 的改进型 One-Stage Detector,在保证速度的情况下,在 COCO 数据集上实现了 state-of-the-art 的准确率。
- ACL神经机器翻译的无监督质量评估
提出了一种无监督方法来进行机器翻译的质量估计,该方法不需要大量专家注释数据、计算和时间来训练。该方法通过从机器翻译系统中提取有用的信息,并采用不确定性量化方法,实现了与人类判断质量的很好相关性,与最先进的监督质量估计模型相媲美。同时,他们还 - 机器翻译质量估计的实用视角
本研究旨在提高机器翻译句子水平的翻译编辑速率预测,提出了句子水平的质量分类(QC)观点,以优化召回率,并通过二进制分类器的使用可将后编辑工作量减少至 50-60%。