Aug, 2018
Arap-Tweet:一个多方言 Twitter 语料库,用于性别、年龄和语言变体识别
Arap-Tweet: A Large Multi-Dialect Twitter Corpus for Gender, Age and Language Variety Identification
Wajdi Zaghouani, Anis Charfi
TL;DR本文介绍了 Arap-Tweet,这是一个涵盖阿拉伯世界 11 个地区和 16 个国家方言变体的大规模、多方言 Tweets 语料库,其中包括针对年龄、性别和方言变体的注释,并讨论了语料库的数据集合和标注方法,以及为阿拉伯语开发作者分析工具和 NLP 工具提供帮助的重要性。