Jul, 2022

ArmanEmo:用于文本情感检测的波斯语数据集

TL;DR介绍了一个超过 7000 个波斯语句子的人工标注情感数据集 ——ArmanEmo,该数据集基于 Ekman 的六种基本情感和 “其他” 类别标注,同时提供了基于现代语言模型的情感分类基线模型。实验结果表明,该数据集具有超越现有波斯语情感数据集的更好泛化能力。