KDDJun, 2023

重新审视仇恨言论基准:从数据筛选到系统部署

TL;DR该研究旨在提出一种名为 GOTHate 的数据集,包含了多语言和多主题,并引入内源信号来增强恶意言论检测任务。作者开发出了一种多语言模型 HEN-mBERT,其通过历史、拓扑和范例等内源信号来改善语义分析。实验结果表明,该模型相较于其他模型提升了 2.5% 的整体宏 F1 值和 5% 的恶意言论 F1 值。