Jun, 2023

推文中禁止阿富汗教育情感分析

TL;DR本文介绍了首个情感标注达里语变体(阿富汗波斯语)数据集,LetHerLearn 数据集包含 7600 条推文,涉及 2012 年塔利班禁止妇女就读教育的反应。我们详细介绍了数据收集和注释过程,并展示了相关数据集统计以及对所得数据集的初始实验,对 Dari 情感分类的不同神经网络架构进行基准测试。