通过机器学习算法,在两个公开数据集上进行实验分析,研究了如何检测和区分真假新闻,结果表明采用了三种分类器:被动型侵略性、朴素贝叶斯和支持向量机,这种方法具有良好的性能表现。
Jan, 2022
我们使用自然语言处理方法对 1876 条新闻数据进行预处理,通过训练模型将假新闻和真实新闻进行分类,最终通过 Naive Bayes 分类器得出 56% 的准确率和平均 32% 的 F1-macro 得分。
Sep, 2023
该研究旨在调查社交媒体上的假新闻检测问题并提出相关算法,主要涵盖社交媒体上的假新闻特征、数据挖掘算法、评估指标等方面。
Aug, 2017
本文通过系统文献综述,描述了使用机器学习分类器自动检测虚假新闻的必要性和方法,因为社交媒体平台上发布的虚假新闻可能会针对个人、社会、组织或政治党派进行宣传,并且人类无法检测到所有这些虚假新闻。
Feb, 2021
本文介绍了如何应用自然语言处理技术解决社交网络上的虚假新闻检测问题,并着重描述了该问题的挑战以及相关任务的形式、数据集和解决方案,并讨论了其潜力和局限性,并提出了更精细、详细、公平和实用的检测模型等研究方向。
Nov, 2018
本文聚焦于自动识别在线新闻中的虚假内容,首先介绍了用于虚假新闻检测的新颖数据集,描述了收集、注释和验证过程,并提供诸多在区分真实和虚假新闻语言差异方面的探索性分析。其次,本文开展了一系列学习实验以构建准确的虚假新闻检测器,并比较了手动和自动识别虚假新闻的结果。
本研究旨在分析目前假新闻检测技术的应用现状,探讨解决方案并指出智能系统在检测错误信息源方面的应用方向,同时提出挑战和方法上的空白以激励未来研究。
Dec, 2020
提出了一个以理论驱动的模型,探索了假新闻在不同层次(词汇、句法、语义和话语)上的表现,并在监督式机器学习框架下进行了检测。在真实世界的两个数据集上的实验证明,该方法可以优于现有技术,并在内容信息有限的情况下实现假新闻的早期检测。
Apr, 2019
提出了两种基于深度学习的模型,用于在多个领域的在线新闻内容中解决虚假新闻检测问题,并在 FakeNews AMT 和 Celebrity 两个数据集上评估,取得了很好的性能并超过了当前最先进的基于手工特征工程的系统。同时,进行了跨领域分析以探索系统在不同领域的适用性。
May, 2020
本研究探讨了将丰富的人类编写的事实信息知识库集成到语言模型中,以提高假新闻检测的效果和鲁棒性。通过使用维基数据等知识库的几种最先进的知识集成方法,在 LIAR 数据集和 COVID-19 数据集这两个广受欢迎的假新闻数据集上进行了实验研究。实验结果表明,基于知识的模型可以显着提高假新闻检测在 LIAR 数据集上的效果,而在 COVID-19 数据集上的混合结果,则强调了领域特定的、最新的知识库的重要性。
Apr, 2022