Jan, 2022

NaijaSenti: 面向多语种情感分析的尼日利亚推特情感语料库

TL;DR介绍了首个针对尼日利亚四种最常用语言(豪萨语、伊博语、尼日利亚皮钦语、约鲁巴语)的大规模人工标注推特情感数据集,并对收集、处理和标注的方法进行了说明。同时对预训练模型和迁移策略进行了评估,并发布数据集、训练模型、情感词典和代码以促进对低资源语言情感分析的研究。