MMMar, 2021
Yorùbá-English 神经机器翻译中领域和重音的影响
The Effect of Domain and Diacritics in Yorùbá-English Neural Machine Translation
David I. Adelani, Dana Ruiter, Jesujoba O. Alabi, Damilola Adebonojo, Adesina Ayeni...
TL;DR本研究提出了 MENYO-20k,这是一个首个多领域平行语料库,专注于干净的约鲁巴语和英语,为基准测试提供标准化的训练集 - 测试集划分。研究人员提供了几个神经机器翻译基准测试,并将它们与流行的预训练(大规模多语种)机器翻译模型的性能进行了比较。出乎意料的是,他们的模型效果超过了谷歌(+8.7 BLEU)和 Facebook M2M(+9.1 BLEU)这样的大规模多语种模型,为未来的研究设定了高质量的基准。