Nov, 2020

XED: 用于情感分析和情绪检测的多语言数据集

TL;DR介绍了一种名为XED的多语种细粒度情感数据集,其中包含人工标注的芬兰语(25k)和英语句子(30k),以及其他30种语言的预测注释,并使用Plutchik的核心情感方法注释该数据集,并添加了中性标签以创建一个多标签多类数据集。使用特定于语言的BERT模型和SVM进行仔细评估,表明该数据集与其他相似数据集相当,因此是情感分析和情感检测的有用工具。