利用参与者词汇一致性进行网络欺凌识别
本研究旨在探讨使用线性支持向量机通过模拟欺凌者、受害者和旁观者的帖子,实现自动检测社交媒体文本中的网络欺凌,并收集并德细注释英语和荷兰语的训练语料库。我们利用丰富的特征集进行一系列二元分类实验,研究哪些信息源对于这一特定任务最有贡献,同时对参数进行优化,分类器在英语和荷兰语分别获得了 64% 和 61% 的 F1 分数,显著优于基于关键字和词单元的基准系统。
Jan, 2018
本研究使用机器学习算法对 Twitter 上的滥用行为进行分类,包括网络欺凌和侵略行为,并通过分析用户、网络和文本属性的差异识别出欺负和侵略者。结果表明,该算法能够以超过 90%的准确率和 AUC 分类这些账户。同时,探讨了 Twitter 标记为滥用行为的用户账户的状况,并研究了 Twitter 可能采用的用户封禁机制的效果。
Jul, 2019
本研究提供了一个广泛的半合成网络欺凌数据集的描述,包括网络欺凌的所有关键要素。该数据集的创建方法简洁地概述,并且还提供了详细的公开可访问数据集的概述。这篇伴随数据文章深入探讨了数据集,增加了透明度并支持复制研究。它还有助于更深入地理解数据,支持更广泛的研究使用。
Feb, 2024
本研究采用深度学习模型和迁移学习方法,对包括 Formspring、Twitter 和 Wikipedia 等多个社交媒体平台的数十万条帖子进行了系统分析,并成功地解决了仅针对单一平台、仅针对特定主题和基于手工特征等问题,为针对多个主题的网络欺凌检测提供了有用的见解。
Jan, 2018
本文调查了最近关于 Cyberbullying 检测方面的文献研究结果。通过使用与文献作者相同的数据集,我们成功再现了他们的结果,并在 YouTube 数据集上进行了扩展研究,研究表明基于深度学习的模型优于先前应用于同一 YouTube 数据集的机器学习模型。我们认为,基于深度学习的模型也可以受益于整合其他信息来源,并研究社交网络中用户相关数据的影响。
Dec, 2018
社交媒体平台、网络欺凌、自动化系统、集成机器学习和挑衅性推文是本研究的关键词。研究通过采用四种特征提取技术,并结合五种机器学习算法,最终实现了 94.00% 的高准确率,优于传统机器学习模型,并超越了之前在相同数据集上的实验结果。
Feb, 2024
通过深度学习方法,特别是采用 BERT 和 BiLSTM 架构,我们的研究介绍了一种针对网络霸凌问题的深度学习方法,可以有效地分析大量帖子并预测潜在的网络霸凌行为。结果表明,我们的 hateBERT 模型在五个模型中表现卓越,达到了 89.16% 的准确率,为实现更安全和更包容的数字化环境作出了重要贡献。
Apr, 2024
该论文通过对推特用户的文本、用户和网络属性的提取和分析,提出了一种有效的、可扩展的方法来检测网络欺凌和攻击行为,并通过机器学习分类算法,在 1.6M 条推文上取得了 90% 以上的准确率。
Feb, 2017