Sep, 2021
AfroMT: 非洲8种语言翻译的预训练策略和可重现基准
AfroMT: Pretraining Strategies and Reproducible Benchmarks for
Translation of 8 African Languages
TL;DR我们提出了AfroMT,这是一个针对非洲8种使用广泛、标准、干净和可重现的机器翻译基准,并开发了诊断系统的一套分析工具,探讨了低资源预训练的可能性,提出了两种基于数据增强的策略,并展示了在11种语言预训练的情况下,数据受限情况下比跨语言转移基线提高了12 BLEU分数的结果。