Feb, 2022

CALCS 2021 共享任务:用于混合语言数据的机器翻译

TL;DR本文关注代码切换社交媒体数据的机器翻译,在监督和非监督环境下提供了英语 - 印地语 - 英语(英 - 汉格利什)、英语 - 西班牙语 - 英语(英 - 西班格利什)和英语 - 现代标准阿拉伯语 - 埃及阿拉伯语(英 - 埃语)的语言对,分享了共同创作语言评估数据时的见解和挑战,并为共享任务中的所有语言提供了基线。在共享任务的排行榜中,共有来自 5 个不同团队的 12 个系统提交。其中最佳表现分别为英语到印地语的 12.67% BLEU 分数和现代标准阿拉伯语 - 埃及阿拉伯语到英语的 25.72% BLEU 分数。