发布前删除推文的检测与推理

May, 2023

Detecting and Reasoning of Deleted Tweets before they are Posted

Hamdy Mubarak, Samir Abdaljalil, Azza Nassar, Firoj Alam

TL;DR本篇研究旨在识别被删除的推文，确定其对应的细分类别以及开发模型以预测推文被删除的可能性及其背后的原因，帮助在推文发出之前进行社交媒体帖子审查。

Abstract

social media platforms empower us in several ways, from information dissemination to consumption. While these platforms are useful in promoting citizen journalism, public awareness etc., they have misuse potentials. Malicious users use them to disseminate →

social media hate-speech deleted tweets arabic context disinformation

发现论文，激发创造

分析和预测 Twitter 上已删除的信息

研究了推特数据中的删除行为，发现删除原因包括隐私、冲动和撤销公开声明，提出一种自动预测删除行为的方法，并分析了哪些推文可能被删除及其原因。

May, 2013

重新考虑推特：在推文创建期间进行干预可减少冒犯内容

本研究在 Twitter 上进行随机对照试验，评估了一种新的干预方法，使发帖者有机会暂停并重新考虑他们的推文，结果发现接受干预的用户比未接受干预的用户发布的冒犯推文少 6％，该干预不仅减少了暂停后的危害推文的数量，还降低了未来的发布和回复数量。因此，让用户重新考虑评论是减少网络冒犯内容的有效机制。

Dec, 2021

仇恨言论检测的作者画像

本文提出了一种基于社区特征的推特用户恶意言论检测方法，实验结果显示该方法在检测恶意言论方面的效果显著优于现有的方法。

Feb, 2019

Twitter 上具有仇恨言论用户的特征和检测

本文主要研究如何优化针对仇恨言论的检测方法，采用了基于用户而非文本内容的方式，最终提出一种基于半监督学习和节点嵌入算法的新型检测方法，在 Twitter 平台上取得了的较好效果。

Mar, 2018

社交媒体上用户分享仇恨言论的因果理解

社交媒体上的仇恨言论威胁着个人的心理和身体健康，也导致现实世界中的暴力行为。本文通过一项全面的因果分析研究了用户属性，探究用户为何转发仇恨言论。我们开发了一个新颖的三步因果框架，关注用户的关注者数量、好友数量、帖子数量以及账号年龄等因素，以此来理解用户分享仇恨言论的动因。了解驱使用户分享仇恨言论的因素对于检测潜在威胁行为的个体以及设计有效的缓解策略至关重要。

Oct, 2023

基于大型语言模型的在线仇恨言论、错误信息和普遍心理健康的拓扑数据映射研究

社交媒体上的仇恨言论和错误信息与心理健康之间存在关联，使用机器学习和大型语言模型，从 Reddit 等社区获取数据并进行分析，揭示了它们在社区中的作用及其与心理障碍和整体心理健康之间的联系。

Sep, 2023

选举相关推文自动检测和分类

本文介绍了一种基于深度神经网络的技术框架，用于在 Twitter 上连续纵向地识别和分析选举相关的对话，其模型可以将选举相关的推文检测的 F 分数为 0.92，并将这些推文分类为 22 个主题，其 F 分数为 0.90。

May, 2016

社交媒体内容算法化审核中被忽视的意图角色

通过考察自动检测和审查系统的最新发展以及训练数据集的成熟度，探讨了作者意图对于内容审查系统的重要性，并提出了改善自动检测和审查系统以符合道德和政策观念的策略性变革。

May, 2024

探究社交媒体中针对仇恨言论的深度学习方法

本文提出利用深度学习方法，结合各种嵌入技术，在社交媒体中检测各种类型的仇恨言论，特别是在包含有限上下文信息的推文中，这是一种非常具有挑战性的任务，三个公开数据集的实验结果表明精确度和 F1 得分都有显著提高。

May, 2020

评估情境信息对于仇恨言论检测的影响

本文通过提供一个西班牙语口音的基于社交媒体中与 COVID-19 相关的新闻发布的用户回复的语料库，证明了对于检测 hate speech，加入上下文信息可以提高自动检测模型的性能。

Oct, 2022