社交媒体中基于突发新闻报道动态的谣言检测学习
本文就社交媒体中的谣言进行了调查研究,介绍和讨论了两种流行的谣言类型,并提出了一个由四个部分组成的谣言分类系统,包括谣言检测、谣言追踪、谣言态度分类和谣言真实性分类。最终总结了社交媒体挖掘中谣言检测和解决的研究方向和建议。
Apr, 2017
本文的研究对象是社交媒体上流传的谣言,以及它们的真实性。研究者通过采集了 9 个事件中包括 330 条谣言推文在内的数据,并应用机器学习算法进行分析,发现了在谣言存在疑问时,人们更倾向于支持这些未经证实的谣言。研究结果表明需要开发更为高效的机器学习算法来判断谣言的真实性,从而避免虚假信息的散播。
Nov, 2015
本文建立了一个自然语言处理系统来预测谣言并探索了谣言和事实的差异,通过 COVID-19 推文分析,结果表明语言结构是区分谣言和事实的更好特征,而谣言推文中包含更多与政治和负面情绪相关的词汇。
Apr, 2023
本文介绍了 PHEME 项目开发的一种收集和抽样会话线程的方法,以及用于识别谣言的工具,并描述了针对 2014 年弗格森动荡期间收集的线程进行的注释任务,结果表明我们可以有效地收集社交媒体谣言并识别与多个故事相关的谣言。
Apr, 2015
本文概述了关于谣言检测领域的最近研究,提供了一个全面的谣言检测数据集列表,并根据他们所利用的信息类型和采取的方法来评估重要的研究,并且也提出了未来研究的几个新方向。
Nov, 2019
本文提出了一种基于情感分类的多任务框架,利用迁移学习技术标记四个假新闻检测和谣言检测数据集,并证明了情感与假新闻和谣言检测的合法性的相关性,进而提供了一种改进的特征提取方法。实验结果证明,该多任务模型在准确性、精确度、召回率和 F1 分数方面一致优于单任务方法,无论是在同领域还是异领域的数据集中。
Nov, 2022
本文旨在开发一个自动化、监督的分类器,使用多任务学习来分类疑点话题中每个个体推文中的立场,从而将高争议的流言标记为潜在的虚假信息。我们的分类器基于高斯过程,探究其有效性并对具有不同特征和立场分布变化的两个数据集进行探索性研究。结果表明,我们的方法始终优于其他基线分类器。特别是在估计与给定流言相关的不同类型立场的分布方面,我们的分类器非常有效。这是我们要提出的一种理想特征,用于跟踪流言并向普通 Twitter 用户和专业新闻从业者发出警告。
Sep, 2016
该论文通过对内容和上下文基于模型在检测新的未知谣言方面的性能差距的深入评估,发现基于上下文的模型过于依赖来自谣言源帖的信息,忽视了上下文信息的重要作用。基于实验结果,该论文还提出了关于如何在训练谣言检测方法时最小化静态数据集中时间概念漂移影响的实用建议。
Sep, 2023
本文提出了一个用于自动检测谣言立场和真实性的多任务学习框架,通过对社交媒体上的巨量数据进行聚类和分析,解决了传统处理方法效率低下的问题,实验证明该方法在 SemEval 2019 的谣言立场分类和真实性预测都优于之前的方法。
Jul, 2020
本文提出了一种基于对抗对比学习框架的谣言检测方法,该方法通过语言对齐和新的监督对比训练范式,将从充分资源的谣言数据中学到的特征适应于低资源的数据;此外,通过对抗增强机制,进一步提高低资源谣言表示的鲁棒性,实验结果表明本文提出的方法可以更好地检测出早期谣言。
Apr, 2022