Feb, 2023

AfriSenti:针对非洲语言的 Twitter 情感分析基准

TL;DR本文介绍了AfriSenti数据集,该数据集由14种非洲语言的110,000多个推文组成,为四个语系中的14种非洲语言提供了14个情感数据集,并由母语为非洲语的人进行了注释。它用于SemEval 2023任务12,这是第一个非洲中心的SemEval共享任务,并描述了数据收集方法,注释过程以及策划每个数据集时遇到的相关挑战。