Sep, 2023

语言资源水平对文本数字处理的语境化

TL;DR通过对语言资源进行清晰的了解,并针对每个类别提供特征和特征的动机,本文开发了一个将语言划分为非常低资源语言、低资源语言、中资源语言、高资源语言和非常高资源语言的矩阵。通过对非洲语言进行语境化和增加对项目中所使用的语言所处范围的理解,可以提供助力于改善研究和实施项目规划等方面的帮助。因此,本文在低资源语言的背景下,论文认为在项目中将语言资源的特征划分为给定的规模是不可或缺的组成部分。