Feb, 2024

翻译错误对跨语言学习中的低资源语言有重大影响

TL;DR在评估跨语言语言理解的常用基准(如 XNLI)中,通过专业翻译人员创建用于多个目标语言的英文评估集的平行版本非常重要,以确保所有目标语言的高质量翻译,以准确地进行跨语言转移的表征。本研究发现,存在翻译的不一致性,并且这些不一致性在 XNLI 中对于低资源语言具有不成比例的影响。通过在多个目标语言的人工翻译和机器翻译目标文本之间进行零 - shot 评估的性能差距来识别这种不一致性,表现出相对较大的差距即为翻译错误的指示。此外,通过对印地语和乌尔都语这两种目标语言进行人工重新注释的方式,我们证实了翻译错误的存在,并发现这些实例与其原始的英文标签之间存在较差的一致性。