探索边界和强度：揭示社交媒体言论的复杂范围

Apr, 2024

探索边界和强度：揭示社交媒体言论的复杂范围

Exploring Boundaries and Intensities in Offensive and Hate Speech: Unveiling the Complex Spectrum of Social Media Discourse

PDF

Abinew Ali Ayele, Esubalew Alemneh Jalew, Adem Chanie Ali, Seid Muhie Yimam, Chris Biemann

TL;DR使用 8,258 条推特进行标注，该研究创建了一个广泛的 Amharic 基准数据集，用于三个任务：分类、识别仇恨目标和评估冒犯和仇恨的强度。结果显示，仇恨和冒犯性言论无法用简单的二元分类解决，并且在连续数值范围内变量化。Afro-XLMR-large 模型在这些任务中表现出最好的性能，分别达到了 75.30％，70.59％和 29.42％的 F1 分数。Afro-XLMR-large 模型的 80.22％相关系数显示了强大的一致性。

Abstract

The prevalence of digital media and evolving sociopolitical dynamics have significantly amplified the dissemination of hateful content. Existing studies mainly focus on classifying texts into binary categories, o

digital media hateful content amharic classification models hate speech

发现论文，激发创造

网络有害言论的多维度识别视角：不只是仇恨

本文介绍了一种使用多个标签注释恶意在线言论的方法，强调了注释应该是细致、准确的。作者发布了一个高质量的数据集，使用六个标签注释了超过 40,000 条有关移民的推文，在此数据集上训练模型的表现优于基准数据集。

Oct, 2022

AlexU-AIC 参加 2022 阿拉伯语仇恨言论：对比分类

本篇研究介绍了使用阿拉伯语推特数据集提交阿拉伯语言仇恨言论 2022 共享任务的解决方案。为了解决细粒度仇恨言论检测中过度拟合的问题，研究人员探究了多种训练模式，如对比学习和多任务学习，最终使用分类微调和五种模型的集成，取得了良好的性能。在子任务 A，B 和 C 中分别实现了 0.841，0.817 和 0.476 的宏 F1 平均分数。

Jul, 2022

自動化檢測仇恨言論及冒犯性語言問題

该研究利用众包的方法，通过使用集成的多分类器和众包获得的仇恨言论词汇，成功区分了具有仇恨言辞、仅具有冒犯性言辞以及没有冒犯性言辞的推文。

Mar, 2017

仇恨言论和辱骂语料库中的交叉偏见

本研究通过对 Twitter 数据集进行分类，发现算法对于辱骂言论和仇恨言论的判别对非裔美国人和非裔男性的偏见较强，这提供了有关算法数据集中交叉偏见的首个系统性证据。

May, 2020

预测 Twitter 会话线程的仇恨强度

本文提出了 DRAGNET++，使用推文线程的语义和传播结构来预测推文的仇恨强度，可以识别出即使是微妙的推文也有可能引发仇恨言论，超越了所有最先进的基线。

Jun, 2022

基于 BERT 的集成方法用于仇恨言论检测

本文聚焦于利用包括 BERT 在内的多个深度模型以及集成学习等技术，对社交媒体上的仇恨言论进行分类，使用三个公开 Twitter 数据集进行实验并考察多种方法的分类性能，最终以新数据集 DHO 进行多标签分类，取得了不错的成果，尤其在集成学习方面表现良好，如在 Davidson 数据集上采用 stacking 技术得到了 97% 的 F1 得分，而在 DHO 数据集上汇聚集成学习技术得到了 77% 的 F1 得分。

Sep, 2022

IndoToxic2024：一份丰富人口统计数据集，用于印度尼西亚语的仇恨言论和毒性类型

印尼互联网仇恨言论和毒性分类数据集的全面介绍以及对利用 BERT 模型和 gpt-3.5-turbo 进行情感分析的结果和注意事项。

Jun, 2024

利用多语言转换器来进行仇恨言论检测

该论文基于 Transformer 语言模型，研究了在社交媒体文本中检测和分类仇恨的问题，并将其固定为三类，同时证明了多语言训练模式的有效性和特定特征对体系结构分类表现的影响。

Jan, 2021

基于 N-gram 和 TFIDF 的机器学习方法在 Twitter 上检测仇恨言论和攻击性语言

本文提出了一种利用机器学习方法，针对推特中的恶意信息、攻击性言论以及清晰文本进行分类的方法，并通过比较实验，得出了最高达 95.6% 准确率的分类模型，同时还开发了中间模块使用户可以方便地访问此工具。

Sep, 2018

基于深度神经网络的改进型 Twitter 两阶段仇恨言论分类

本文借助改进的 LSTM 神经网络架构，提出了一种基于 One-vs-Rest 分类器的两阶段方案，用于在社交媒体上自动检测仇恨性内容，并在公共语料库和其他数据集上进行了实验，结果显示其在仇恨言论检测任务中具有卓越的分类性能。

Jun, 2022