互联网索赔数据集及其情感与可信度比较
本篇论文研究了如何在社交媒体中找出虚假新闻。作者提出了基于语言学、可信度、语义等各种特征来自动识别虚假新闻的方法,并使用三个不同的测试集测试了该方法,在高精度的情况下可以准确地区分真实新闻和虚假新闻。
Nov, 2019
该研究综述了关于社交网络上的假新闻的检测、表征和缓解的最新进展,着重于数据驱动的方法和分类特征以及用于训练分类方法的数据集,并强调了解决假新闻最有前途的新兴方法。
Feb, 2019
社交媒体兴起以来,越来越多的网民在线上分享和阅读帖子和新闻。然而,泛滥于互联网的大量错误信息(例如虚假新闻和谣言)会对人们的生活产生负面影响,这引发了对谣言和虚假新闻检测的热门研究课题。网民在社交媒体帖子和新闻中表达的情绪和情感是帮助区分虚假新闻和真实新闻,以及理解谣言传播的重要因素。本文全面回顾基于情绪的误信息检测方法。我们首先解释情绪与误信息之间的紧密联系。接着,我们详细分析了多种基于情绪、情感和立场特征的误信息检测方法,描述它们的优势和劣势。最后,我们讨论了基于大型语言模型的基于情绪的误信息检测面临的一些挑战,并提出了未来的研究方向,包括数据收集(多平台、多语言)、标注、基准测试、多模态以及可解释性。
Nov, 2023
通过情感分析比较真假新闻的语言使用,并考虑了社交媒体和在线新闻来源的虚假信息类型(宣传、谣言、点击草率和讽刺); 我们的实验表明,虚假信息在每种类型中都具有不同的情感模式,情感在欺骗读者方面发挥了关键作用; 基于此,我们提出了一个采用情感注入的 LSTM 神经网络模型来检测假新闻。
Aug, 2019
通过提供包含新闻内容、社会背景和动态信息的数据集,本文旨在促进对社交媒体上假新闻的传播、检测和干预的研究,强调了假新闻检测的复杂性,并结合多源信息提出了可能的解决方案。
Sep, 2018
这份综合调查是研究人员在进行假新闻检测之旅中不可或缺的资源,通过强调数据集质量和多样性的关键作用,它强调了这些元素对检测模型的有效性和稳健性的重要性。调查详细概述了数据集的关键特征、使用的各种标记系统和可能影响模型性能的普遍偏见。此外,它还涉及关键的伦理问题和最佳实践,为当前可用数据集的情况提供了全面的概述。我们为该领域的贡献进一步丰富,提供了 GitHub 存储库,将公开可访问的数据集汇集到一个单一且用户友好的门户中。这个存储库旨在促进和推动进一步的研究和开发工作,旨在解决普遍存在的假新闻问题。
Jul, 2024
本研究提供 FACTIFY2 这一多模态事实核查数据集以及相关算法,并使用新数据源和添加讽刺文章来改进 FACTIFY1,FACTIFY2 具有 50,000 个新实例数据,包含支持、无证据和驳斥三个分类以及文本和视觉数据的三个子分类,使用基于 BERT 和 Vision Transformer 的基础模型的测试集 F1 分数为 65%。
Apr, 2023
本文旨在研究预测新闻媒体报道的真实性和偏见。通过大量的新闻网站以及一些从文章、维基百科页面、推特账户、网址结构和流量信息中得出的特征,实验表明本方法相比基线有较显著的性能提升,且各特征类型都至关重要。
Oct, 2018
本文对虚假信息的不同方面进行了全面调研,包括虚假信息传播的行为者、成功欺骗读者的理由、虚假信息的影响和特征、检测虚假信息的算法以及未来的研究方向。
Apr, 2018