本文是一篇关于社交媒体上仇恨言论的系统性量化研究,使用了 Whisper 和 Twitter 两个社交媒体平台,采用一种新的方法来识别和分析仇恨言论的目标,旨在为防范和识别社交媒体上的仇恨言论提供方向。
Mar, 2016
本文提出了一种基于社区特征的推特用户恶意言论检测方法,实验结果显示该方法在检测恶意言论方面的效果显著优于现有的方法。
Feb, 2019
通过社群检测方法和词嵌入模型,本研究发现标记数据和关键词方法在探测新兴极端组织使用的词汇时效果不佳,提出使用学到的代号词汇来识别 hate speech 的方法,通过实验得出该方法的准确度比使用关键词更高,可以被应用于自动化 hate speech 检测。
Nov, 2017
本综述旨在总结现有关于自然语言处理中针对在线仇恨言论检测模型泛化能力的研究结果、对现有模型泛化难题的原因进行解释、总结已有解决方案,并提出未来改善检测模型泛化能力的研究方向。
Feb, 2021
本文通过使用字符 n-gram、单词 n-gram 和单词 skip-gram 的方法,利用最近发布的 annotated dataset 建立基于词汇的垃圾言论检测任务,并成功实现了 78% 的准确率。研究结果表明,区分垃圾言论和粗俗言论之间的主要难题在于歧视。最后,文章提出了未来的研究方向。
Dec, 2017
研究分析了恶意用户和非恶意用户在 Gab(gab.com)上生成的帖子的流动和动态,并发现恶意内容扩散得更远、更广、更快,具有更大的影响力。恶意用户更具有影响力、受欢迎和凝聚力,这扩展了我们对线上仇恨言论的理解。
Dec, 2018
本文提出利用深度学习方法,结合各种嵌入技术,在社交媒体中检测各种类型的仇恨言论,特别是在包含有限上下文信息的推文中,这是一种非常具有挑战性的任务,三个公开数据集的实验结果表明精确度和 F1 得分都有显著提高。
May, 2020
探讨了自动检测恶意言论的各种挑战,并提供了一个分层组织的问题列表。在数据级别、模型级别和人类级别分别区分了挑战,并对每个层次进行了详尽的分析,以帮助研究人员更有效地设计其在恶意言论检测领域中的解决方案。
Sep, 2022
本文主要研究如何优化针对仇恨言论的检测方法,采用了基于用户而非文本内容的方式,最终提出一种基于半监督学习和节点嵌入算法的新型检测方法,在 Twitter 平台上取得了的较好效果。
Mar, 2018
提出一种新颖的深度学习模型 ——DeepHate,以使用多方面的文本表示方法(如词嵌入、情感和主题信息),自动检测在线社交平台上的仇恨言论。在三个公开可用的实际数据集上进行了广泛的实验和评估,结果表明 DeepHate 在检测仇恨言论的任务上优于现有技术水平,并进行了案例研究,以提供有助于检测在线社交平台上的仇恨言论的显着功能的见解。
Mar, 2021