Oct, 2022

南非语地区的多语言机器翻译:开普敦大学 WMT22 系统

TL;DR该论文讲述了开普敦大学提交给 WMT22 大规模机器翻译评估竞赛的受限跟踪的情况。该系统是一个单一的多语种翻译模型,可在英语和 8 种南部 / 东南部非洲语言之间进行翻译,并可在特定的非洲语言对之间进行翻译。该研究采用了多种适用于低资源机器翻译的技术,包括重叠 BPE、回译、合成训练数据生成以及在训练过程中增加更多的翻译方向。结果表明,这些技术的价值尤为突出,特别是对于非常少或没有双语训练数据可用的方向。