数据扩增语义关系推理在反亚裔仇恨言论检测中的应用

AAAIApr, 2022

数据扩增语义关系推理在反亚裔仇恨言论检测中的应用

Anti-Asian Hate Speech Detection via Data Augmented Semantic Relation Inference

Jiaxuan Li, Yue Ning

TL;DR本研究提出了一种新方法，利用情感话题标记在自然语言推理框架中增强仇恨言论检测，并在实际数据集上证明了其相对于现有表示学习模型的有效性。

Abstract

With the spreading of hate speech on social media in recent years, automatic detection of hate speech is becoming a crucial task and has a

hate speech social media sentiment hashtags natural language inference representation learning

发现论文，激发创造

评估情境信息对于仇恨言论检测的影响

本文通过提供一个西班牙语口音的基于社交媒体中与 COVID-19 相关的新闻发布的用户回复的语料库，证明了对于检测 hate speech，加入上下文信息可以提高自动检测模型的性能。

Oct, 2022

利用用户内部和用户间的表示学习进行自动化的仇恨言论检测

本文通过在 Twitter 上收集和分析用户历史记录来建模用户内部 Tweet 表示，以及使用增强的用户间表示学习技术，对其他用户发布的类似推文进行建模，从而显着提高了强双向 LSTM 基线模型的 f-score10.1％。

Apr, 2018

基于 BERT 的在线社交媒体仇恨言论检测的迁移学习方法

本研究提出了一种基于 BERT 和 Transfer Learning 的新型方案，以捕获社交媒体内容中的仇恨语境，并证明该方案能有效解决标注数据不足和存在偏差的问题，使得模型性能得到提升。

Oct, 2019

DeepHate: 多维文本表示的仇恨言论检测

提出一种新颖的深度学习模型 ——DeepHate，以使用多方面的文本表示方法（如词嵌入、情感和主题信息），自动检测在线社交平台上的仇恨言论。在三个公开可用的实际数据集上进行了广泛的实验和评估，结果表明 DeepHate 在检测仇恨言论的任务上优于现有技术水平，并进行了案例研究，以提供有助于检测在线社交平台上的仇恨言论的显着功能的见解。

Mar, 2021

预测 Twitter 会话线程的仇恨强度

本文提出了 DRAGNET++，使用推文线程的语义和传播结构来预测推文的仇恨强度，可以识别出即使是微妙的推文也有可能引发仇恨言论，超越了所有最先进的基线。

Jun, 2022

在社交媒体上检测仇恨言论

本文通过使用字符 n-gram、单词 n-gram 和单词 skip-gram 的方法，利用最近发布的 annotated dataset 建立基于词汇的垃圾言论检测任务，并成功实现了 78% 的准确率。研究结果表明，区分垃圾言论和粗俗言论之间的主要难题在于歧视。最后，文章提出了未来的研究方向。

Dec, 2017

建立仇恨言论检测数据集的信息检索方法

通过信息检索领域的标准方法，采用池化和主动学习技术及任务分解和注释说明技巧，构建了一个更全面的针对 Twitter 中仇恨言论检测的基准数据集，并显示了现有检测模型在这些更广泛的仇恨形式测试中准确度的显著下降。

Jun, 2021

社交媒体仇恨言论检测的迁移学习

本文介绍了一种机器学习和自然语言处理模型，通过自动识别网页文本中的仇恨言论以及利用迁移学习技术构建了一个识别仇恨言论的表示方法，并开发了一个可视化工具用于多个数据集的简要分析。

Jun, 2019

只需要 "爱": 回避仇恨言论检测

该研究在对七种针对仇恨言论检测的最先进模型进行分析后，得出了基于数据类型和标注标准重要性大于模型架构的结论，并证明了字符级特征可以有效抵御自动插入错别字等对抗攻击。

Aug, 2018

利用受害者的仇恨进行越南社交媒体文本中的仇恨言论检测

社交媒体上激进内容的快速传播促使了对仇恨言论的检测任务的需求，本论文提供了一种构建用于针对性仇恨言论检测的系统的方法，并介绍了一个越南社交媒体文本的针对性仇恨言论检测数据集，并结合预训练语言模型与基于文本表征的 Bi-GRU-LSTM-CNN 模型建立了基线模型，最终提出了一种方法将该模型整合至在线流媒体系统，以在社交媒体上防止令人讨厌和冒犯性内容的实际应用。

Apr, 2024