本文通过提供一个西班牙语口音的基于社交媒体中与 COVID-19 相关的新闻发布的用户回复的语料库,证明了对于检测 hate speech,加入上下文信息可以提高自动检测模型的性能。
Oct, 2022
本文通过在 Twitter 上收集和分析用户历史记录来建模用户内部 Tweet 表示,以及使用增强的用户间表示学习技术,对其他用户发布的类似推文进行建模,从而显着提高了强双向 LSTM 基线模型的 f-score10.1%。
Apr, 2018
本研究提出了一种基于 BERT 和 Transfer Learning 的新型方案,以捕获社交媒体内容中的仇恨语境,并证明该方案能有效解决标注数据不足和存在偏差的问题,使得模型性能得到提升。
Oct, 2019
提出一种新颖的深度学习模型 ——DeepHate,以使用多方面的文本表示方法(如词嵌入、情感和主题信息),自动检测在线社交平台上的仇恨言论。在三个公开可用的实际数据集上进行了广泛的实验和评估,结果表明 DeepHate 在检测仇恨言论的任务上优于现有技术水平,并进行了案例研究,以提供有助于检测在线社交平台上的仇恨言论的显着功能的见解。
Mar, 2021
本文提出了 DRAGNET++,使用推文线程的语义和传播结构来预测推文的仇恨强度,可以识别出即使是微妙的推文也有可能引发仇恨言论,超越了所有最先进的基线。
Jun, 2022
本文通过使用字符 n-gram、单词 n-gram 和单词 skip-gram 的方法,利用最近发布的 annotated dataset 建立基于词汇的垃圾言论检测任务,并成功实现了 78% 的准确率。研究结果表明,区分垃圾言论和粗俗言论之间的主要难题在于歧视。最后,文章提出了未来的研究方向。
Dec, 2017
通过信息检索领域的标准方法,采用池化和主动学习技术及任务分解和注释说明技巧,构建了一个更全面的针对 Twitter 中仇恨言论检测的基准数据集,并显示了现有检测模型在这些更广泛的仇恨形式测试中准确度的显著下降。
Jun, 2021
本文介绍了一种机器学习和自然语言处理模型,通过自动识别网页文本中的仇恨言论以及利用迁移学习技术构建了一个识别仇恨言论的表示方法,并开发了一个可视化工具用于多个数据集的简要分析。
Jun, 2019
该研究在对七种针对仇恨言论检测的最先进模型进行分析后,得出了基于数据类型和标注标准重要性大于模型架构的结论,并证明了字符级特征可以有效抵御自动插入错别字等对抗攻击。
Aug, 2018
社交媒体上激进内容的快速传播促使了对仇恨言论的检测任务的需求,本论文提供了一种构建用于针对性仇恨言论检测的系统的方法,并介绍了一个越南社交媒体文本的针对性仇恨言论检测数据集,并结合预训练语言模型与基于文本表征的 Bi-GRU-LSTM-CNN 模型建立了基线模型,最终提出了一种方法将该模型整合至在线流媒体系统,以在社交媒体上防止令人讨厌和冒犯性内容的实际应用。
Apr, 2024