EMNLPSep, 2021

AfroMT: 非洲 8 种语言翻译的预训练策略和可重现基准

TL;DR我们提出了 AfroMT,这是一个针对非洲 8 种使用广泛、标准、干净和可重现的机器翻译基准,并开发了诊断系统的一套分析工具,探讨了低资源预训练的可能性,提出了两种基于数据增强的策略,并展示了在 11 种语言预训练的情况下,数据受限情况下比跨语言转移基线提高了 12 BLEU 分数的结果。