Apr, 2024

探索边界和强度:揭示社交媒体言论的复杂范围

TL;DR使用 8,258 条推特进行标注,该研究创建了一个广泛的 Amharic 基准数据集,用于三个任务:分类、识别仇恨目标和评估冒犯和仇恨的强度。结果显示,仇恨和冒犯性言论无法用简单的二元分类解决,并且在连续数值范围内变量化。Afro-XLMR-large 模型在这些任务中表现出最好的性能,分别达到了 75.30%,70.59%和 29.42%的 F1 分数。Afro-XLMR-large 模型的 80.22%相关系数显示了强大的一致性。