ACLMar, 2022

低资源语料挖掘的更好质量估计

TL;DR提出一种使用多任务训练、数据增强和对比学习相结合的方法,从而提高质量估计模型在现实应用中的鲁棒性,并在 Parallel Corpus Mining 样本集上进行了测试,结果表明该方法的效果比现有方法要好很多,在 PCM 精度上提高了超过 0.80,使用的数据量较少