深度学习用于仇恨言论检测:一项比较研究
本文提出利用深度学习方法,结合各种嵌入技术,在社交媒体中检测各种类型的仇恨言论,特别是在包含有限上下文信息的推文中,这是一种非常具有挑战性的任务,三个公开数据集的实验结果表明精确度和 F1 得分都有显著提高。
May, 2020
探讨了自动检测恶意言论的各种挑战,并提供了一个分层组织的问题列表。在数据级别、模型级别和人类级别分别区分了挑战,并对每个层次进行了详尽的分析,以帮助研究人员更有效地设计其在恶意言论检测领域中的解决方案。
Sep, 2022
针对在线仇恨言论的自动检测是 NLP 领域的一个研究热点。本文通过对不同的仇恨言论检测数据集进行微调,分析了数据集通用性的差异,并证明了数据集的组合能够促进强大的仇恨言论检测模型的发展。
Jul, 2023
该研究探讨使用深度学习对 hate speech 进行自动检测,基于生成的 1 百万条数据集进行模型训练,在公共 hate speech 数据集上获得了显著的性能提升,提高了对多样的 hate speech 序列的高灵敏检测能力,为实现完全自动化的解决方案铺平了道路。
May, 2020
提出一种新颖的深度学习模型 ——DeepHate,以使用多方面的文本表示方法(如词嵌入、情感和主题信息),自动检测在线社交平台上的仇恨言论。在三个公开可用的实际数据集上进行了广泛的实验和评估,结果表明 DeepHate 在检测仇恨言论的任务上优于现有技术水平,并进行了案例研究,以提供有助于检测在线社交平台上的仇恨言论的显着功能的见解。
Mar, 2021
通过对针对性别少数群体的仇恨言论的具体例子,本文分析了仇恨言论检测所面临的问题,并提出了一个以数据为中心的综合框架,以跨七个广泛的维度来概括数据创建流程,同时指出实践者将从按照该框架来创建未来的仇恨言论数据集中获益。
Sep, 2023
该研究在对七种针对仇恨言论检测的最先进模型进行分析后,得出了基于数据类型和标注标准重要性大于模型架构的结论,并证明了字符级特征可以有效抵御自动插入错别字等对抗攻击。
Aug, 2018
本研究通过多种深度学习架构的实验,应用语义词嵌入学习技术来解决 Twitter 上仇恨言论识别的问题,并通过基准数据集的 16K 个注释推断出该方法相较于现有的字符 / 单词 n 元方法有 18 个 F1 分数的提升。
Jun, 2017
针对社交媒体上在线仇恨言论问题,提出了一种基于集成深度学习模型的新框架,包括对未标记数据集的自动分类、调整因子和弱监督学习方法,可有效提高依恋集等小众平台的恶意言论检测率。
Nov, 2020
本文对社交媒体上仇恨言论检测和追踪的问题进行了系统综述,重点关注自然语言处理和深度学习技术,概述了该领域的文献、方法和限制,并提出未来研究方向。
May, 2021