MMMar, 2021

Yorùbá-English 神经机器翻译中领域和重音的影响

TL;DR本研究提出了 MENYO-20k,这是一个首个多领域平行语料库,专注于干净的约鲁巴语和英语,为基准测试提供标准化的训练集 - 测试集划分。研究人员提供了几个神经机器翻译基准测试,并将它们与流行的预训练(大规模多语种)机器翻译模型的性能进行了比较。出乎意料的是,他们的模型效果超过了谷歌(+8.7 BLEU)和 Facebook M2M(+9.1 BLEU)这样的大规模多语种模型,为未来的研究设定了高质量的基准。