Sep, 2023

COMETKIWI规模化:Unbabel-IST 2023的质量估计共享任务提交

TL;DR我们介绍了Unbabel和Instituto Superior Técnico在WMT 2023共享任务上对资料估计(QE)的联合贡献。我们的团队参与了所有任务:句子和单词水平的质量预测(任务1)以及精细错误跨度检测(任务2)。对于所有任务,我们基于COMETKIWI-22模型(Rei et al., 2022b)进行开发。我们的多语种方法在所有任务中排名第一,在单词、跨度和句子级别的质量估计方面达到了最新水平的性能。与以前的最新技术COMETKIWI-22相比,我们在与人类判断相关性方面取得了很大的改进(达到了10个Spearman分数)。此外,我们在共享任务中超过了第二好的多语种提交,达到了3.8个绝对分数。