Feb, 2024

多语种机器翻译中目标方传输和正则化的角色解构

TL;DR多语言机器翻译(MMT)通过不同语言对之间的知识迁移而受益。本文通过在目标辅助语言方面进行大规模研究,涉及语言相似性和语料库大小等两个维度,展示了知识迁移对主要语言对的动态影响。我们发现,在语言相似的辅助目标语言中,存在强烈的正向知识迁移能力,并且随着相似目标语言规模的增加,正向迁移效果进一步增强,有利于主要语言对。与此同时,我们发现远距离的辅助目标语言即使拥有较小的正向迁移能力,也能意外地对主要语言对产生正面影响。此外,我们还展示了远距离的辅助目标语言可以作为一种正则化器,通过增强广义化和模型推理校正来提高翻译性能。