本文提出了一种针对阿拉伯社交媒体(例如 Youtube)中针对女性的仇恨言论的检测方法,并使用不同的机器学习算法对新的阿拉伯语仇恨言论语料库进行了验证和比较,结果表明卷积神经网络模型具有最佳性能。
Apr, 2021
本研究旨在解决 Facebook 评论中的攻击性和辱骂性内容检测问题,针对阿尔及利亚方言阿拉伯语进行探讨,使用 BiLSTM,CNN,FastText,SVM 和 NB 等文本分类器进行多项实验,并建立了一个包含 8.7k 手动标注为正常,虐待和攻击性的文本的新语料库。结果表明,分类器的性能尚可,但需要进一步研究语言特征以提高识别精度。
Mar, 2022
使用基于 Transformer 模型的算法来检测社交媒体上的仇恨言论,无论语言如意大利语、英语、德语还是孟加拉语,该模型的检测准确率较现有基准和最先进模型提高,其成功率达到了 89%(孟加拉语)、91%(英语和德语)以及 77%(意大利语)
Jan, 2024
本文提出利用深度学习方法,结合各种嵌入技术,在社交媒体中检测各种类型的仇恨言论,特别是在包含有限上下文信息的推文中,这是一种非常具有挑战性的任务,三个公开数据集的实验结果表明精确度和 F1 得分都有显著提高。
May, 2020
提出一种新颖的深度学习模型 ——DeepHate,以使用多方面的文本表示方法(如词嵌入、情感和主题信息),自动检测在线社交平台上的仇恨言论。在三个公开可用的实际数据集上进行了广泛的实验和评估,结果表明 DeepHate 在检测仇恨言论的任务上优于现有技术水平,并进行了案例研究,以提供有助于检测在线社交平台上的仇恨言论的显着功能的见解。
Mar, 2021
本研究对深度和浅层仇恨言论检测方法进行了大规模实证比较,并以常用数据集为媒介,特别关注实际性能和实践指导,以提供指导,并确定未来的研究方向。
Feb, 2022
本文针对社交媒体上孟加拉语仇恨言论检测的挑战,通过众包标注和专家验证构建了一个包含 30,000 条用户评论的数据集,并利用多个深度学习模型对其进行了实验。结果表明将 SVM 用于该数据集能够获得 87.5% 的准确率,该数据集将推动孟加拉语仇恨言论检测领域的未来研究机会。
Dec, 2020
该研究探讨使用深度学习对 hate speech 进行自动检测,基于生成的 1 百万条数据集进行模型训练,在公共 hate speech 数据集上获得了显著的性能提升,提高了对多样的 hate speech 序列的高灵敏检测能力,为实现完全自动化的解决方案铺平了道路。
本篇研究介绍了使用阿拉伯语推特数据集提交阿拉伯语言仇恨言论 2022 共享任务的解决方案。为了解决细粒度仇恨言论检测中过度拟合的问题,研究人员探究了多种训练模式,如对比学习和多任务学习,最终使用分类微调和五种模型的集成,取得了良好的性能。 在子任务 A,B 和 C 中分别实现了 0.841,0.817 和 0.476 的宏 F1 平均分数。
Jul, 2022
探讨了自动检测恶意言论的各种挑战,并提供了一个分层组织的问题列表。在数据级别、模型级别和人类级别分别区分了挑战,并对每个层次进行了详尽的分析,以帮助研究人员更有效地设计其在恶意言论检测领域中的解决方案。
Sep, 2022