Dec, 2023

构建东北印度极低资源语言机器翻译平行语料的首次尝试

TL;DR该论文介绍了为印度东北地区的十三种资源非常匮乏的语言创建初始的双语语料库,同时提供了这些语言的初始翻译结果。该论文还创建了这些语言的首个平行语料库,并提供了关于这些语言的基准神经机器翻译结果。我们打算将这些语料库扩展到包括大量资源匮乏的印度语言,并结合我们之前在非洲和美洲印第安语言方面的工作,创建覆盖世界各地大量语言的语料库。