Mar, 2021
Fon 语的低资源神经机器翻译基于众包的基于短语的分词
Crowdsourced Phrase-Based Tokenization for Low-Resourced Neural Machine Translation: The Case of Fon Language
Bonaventure F. P. Dossou, Chris C. Emezue
TL;DR本研究主要针对非洲土著语言的神经机器翻译问题,提出基于 Word-Expressions-Based 的超词标记策略,相较于其他标记方法可以更好地应对具有语法、韵律、声调特征的非洲语言翻译训练的困难性。实验结果表明,在 Fon - 法语和法语 - Fon 的翻译任务中,基于该方法得到的 NMT 模型更加可靠。