COLINGOct, 2022

重新审视音节在语言建模中的作用及其在低资源机器翻译上的应用

TL;DR本文探讨利用音节对语言建模和机器翻译的作用。通过 21 种语言的实验,我们发现音节优于字符和其他的子词。在对一个非相关和低资源语言组(西班牙语 - Shipibo-Konibo)进行翻译时,音节在成对的和多语言的系统中优于无监督的子词和进一步的形态分割方法。最后,我们进行了一些人类评估,并讨论了局限和机遇。