网络仇恨：解决在线社交空间中的仇恨言论问题

Sep, 2017

网络仇恨：解决在线社交空间中的仇恨言论问题

A Web of Hate: Tackling Hateful Speech in Online Social Spaces

Haji Mohammad Saleem, Kelly P Dillon, Susan Benesch, Derek Ruths

TL;DR该研究论文探讨在线社交平台上仇恨性言论的检测方法，指出基于关键词方法检测的不足，并提出利用自我定义仇恨社区产生的内容作为训练数据的方法，实现了良好的检测性能。

Abstract

online social platforms are beset with hateful speech - content that expresses hatred for a person or group of people. Such content can frighten, intimidate, or silence platform users, and some of it can inspire

hateful speech online social platforms detection methods self-identifying hateful communities training data

发现论文，激发创造

分析在线社交媒体中的仇恨目标

本文是一篇关于社交媒体上仇恨言论的系统性量化研究，使用了 Whisper 和 Twitter 两个社交媒体平台，采用一种新的方法来识别和分析仇恨言论的目标，旨在为防范和识别社交媒体上的仇恨言论提供方向。

Mar, 2016

仇恨言论检测的作者画像

本文提出了一种基于社区特征的推特用户恶意言论检测方法，实验结果显示该方法在检测恶意言论方面的效果显著优于现有的方法。

Feb, 2019

社交媒体中的上下文仇恨言论词汇挖掘

通过社群检测方法和词嵌入模型，本研究发现标记数据和关键词方法在探测新兴极端组织使用的词汇时效果不佳，提出使用学到的代号词汇来识别 hate speech 的方法，通过实验得出该方法的准确度比使用关键词更高，可以被应用于自动化 hate speech 检测。

Nov, 2017

走向可推广的仇恨言论检测：障碍与解决方案综述

本综述旨在总结现有关于自然语言处理中针对在线仇恨言论检测模型泛化能力的研究结果、对现有模型泛化难题的原因进行解释、总结已有解决方案，并提出未来改善检测模型泛化能力的研究方向。

Feb, 2021

在社交媒体上检测仇恨言论

本文通过使用字符 n-gram、单词 n-gram 和单词 skip-gram 的方法，利用最近发布的 annotated dataset 建立基于词汇的垃圾言论检测任务，并成功实现了 78% 的准确率。研究结果表明，区分垃圾言论和粗俗言论之间的主要难题在于歧视。最后，文章提出了未来的研究方向。

Dec, 2017

在线社交媒体中仇恨言论的扩散

研究分析了恶意用户和非恶意用户在 Gab（gab.com）上生成的帖子的流动和动态，并发现恶意内容扩散得更远、更广、更快，具有更大的影响力。恶意用户更具有影响力、受欢迎和凝聚力，这扩展了我们对线上仇恨言论的理解。

Dec, 2018

探究社交媒体中针对仇恨言论的深度学习方法

本文提出利用深度学习方法，结合各种嵌入技术，在社交媒体中检测各种类型的仇恨言论，特别是在包含有限上下文信息的推文中，这是一种非常具有挑战性的任务，三个公开数据集的实验结果表明精确度和 F1 得分都有显著提高。

May, 2020

基于机器学习的自动化仇恨言论检测中的挑战综述

探讨了自动检测恶意言论的各种挑战，并提供了一个分层组织的问题列表。在数据级别、模型级别和人类级别分别区分了挑战，并对每个层次进行了详尽的分析，以帮助研究人员更有效地设计其在恶意言论检测领域中的解决方案。

Sep, 2022

Twitter 上具有仇恨言论用户的特征和检测

本文主要研究如何优化针对仇恨言论的检测方法，采用了基于用户而非文本内容的方式，最终提出一种基于半监督学习和节点嵌入算法的新型检测方法，在 Twitter 平台上取得了的较好效果。

Mar, 2018

DeepHate: 多维文本表示的仇恨言论检测

提出一种新颖的深度学习模型 ——DeepHate，以使用多方面的文本表示方法（如词嵌入、情感和主题信息），自动检测在线社交平台上的仇恨言论。在三个公开可用的实际数据集上进行了广泛的实验和评估，结果表明 DeepHate 在检测仇恨言论的任务上优于现有技术水平，并进行了案例研究，以提供有助于检测在线社交平台上的仇恨言论的显着功能的见解。

Mar, 2021