Mar, 2024

NaijaHate: 用代表性数据评估尼日利亚推特上的仇恨言论检测

TL;DR通过引入 NaijaHate 数据集、提出 NaijaXLM-T 模型以及使用领域自适应预训练和微调的方法,我们展示了针对恶意言论检测 (HSD) 在低资源环境中进行系统保护的重要性,同时揭示了在偏见数据集上评估 HSD 会严重高估其在真实环境中的性能,并表明在尼日利亚推特上进行人为辅助的内容审核可以有效减少恶意内容。