Sep, 2023

NJUNLP 参加 WMT2023 质量评估共享任务

TL;DR我们介绍了 NJUNLP 团队在 WMT 2023 质量估计(QE)共享任务中的提交。我们的团队针对英德语言对,对两个子任务进行了预测:(i)句子和单词级质量预测;(ii)细粒度错误跨度检测。今年,我们在 NJUQE 框架上进一步探索了基于伪数据方法的 QE。我们使用 WMT 翻译任务的平行数据生成伪 MQM 数据。我们在伪 QE 数据上对 XLMR 大模型进行预训练,然后在真实 QE 数据上进行微调。在这两个阶段,我们同时学习句子级分数和单词级标签。通过实验证明,我们进行了实验以找到提高性能的关键超参数。在技术上,我们提出了一种简单的方法,将单词级输出转换为细粒度错误跨度结果。总的来说,我们的模型在英德语言对的单词级和细粒度错误跨度检测子任务中取得了最佳结果,并且差距明显。