Jul, 2022

TArC: 突尼斯阿拉伯语语料库的首个完整版本发布

TL;DR本研究在于使用阿拉伯语拉丁写法(Arabizi)对突尼斯阿拉伯语进行编码,在此基础上创建了一个包含语料库和 NLP 工具的资源,用于提供各级语言信息的词语分类、音译、标记、词形归总等,并讨论了使用计算和语言方法进行研究路径和实验的策略等问题,最终提供了可能广泛用于计算和语言研究的资源。