寻找可信新闻
本文聚焦于自动识别在线新闻中的虚假内容,首先介绍了用于虚假新闻检测的新颖数据集,描述了收集、注释和验证过程,并提供诸多在区分真实和虚假新闻语言差异方面的探索性分析。其次,本文开展了一系列学习实验以构建准确的虚假新闻检测器,并比较了手动和自动识别虚假新闻的结果。
Aug, 2017
使用机器学习算法分析媒体新闻的语言特征,以区分真假新闻,主要解决神经假新闻生成、机器生成的标题、文本和图像标题之间的语义矛盾等问题。同时提出应用特征集和类别、特征之间的相关性计算相关属性评估指标和计算属性变量的协方差指标来模拟这些问题。其中独特、负面、积极和基数数字特征在度量中得分高,能够提供高的 AUC 和 F1-score。
Nov, 2022
本文介绍了利用 snopes.com 收集数据并构建数据集,帮助理解所谓 “假新闻” 传播背后的机制,我们还形式化定义了网络主张以及其可信度和情感,并探讨了情感与可信度之间的关系。
Nov, 2019
本文探讨了现有的假新闻检测方法存在的问题,并提出加入事实核查与语言分析相结合的方法,以应对新闻篡改攻击和真实新闻被误判的情况。作者提出采用众包知识图谱解决新闻事件事实搜集的问题。
Jan, 2019
本文介绍了如何应用自然语言处理技术解决社交网络上的虚假新闻检测问题,并着重描述了该问题的挑战以及相关任务的形式、数据集和解决方案,并讨论了其潜力和局限性,并提出了更精细、详细、公平和实用的检测模型等研究方向。
Nov, 2018
本文提出了一种新的结构感知多头注意力网络(SMAN),该网络通过联合优化假新闻检测和可信度预测任务,明确地利用出版商和用户的可信度进行早期假新闻检测,实验结果表明 SMAN 可以在 4 小时内以超过 91% 的准确率检测出假新闻,比现有模型快得多。
Dec, 2020
我们使用自然语言处理方法对 1876 条新闻数据进行预处理,通过训练模型将假新闻和真实新闻进行分类,最终通过 Naive Bayes 分类器得出 56% 的准确率和平均 32% 的 F1-macro 得分。
Sep, 2023
提出了两种基于深度学习的模型,用于在多个领域的在线新闻内容中解决虚假新闻检测问题,并在 FakeNews AMT 和 Celebrity 两个数据集上评估,取得了很好的性能并超过了当前最先进的基于手工特征工程的系统。同时,进行了跨领域分析以探索系统在不同领域的适用性。
May, 2020
为了解决当今科技驱动的世界中虚假新闻(尤其是在选举等关键事件期间)的快速传播给信息的完整性带来的日益威胁,我们引入了 FakeWatch,一个全面的框架,旨在有效检测虚假新闻。通过利用一个新的精选北美选举相关新闻文章的数据集,我们构建了强大的分类模型。我们的框架融合了传统机器学习技术和尖端语言模型,以有效区分虚假新闻。我们的总体目标是为研究社区提供适应不断演变的误导信息领域的可调整和精确的分类模型。对我们的数据集上的虚假新闻分类器的定量评估表明,虽然最先进的语言模型略优于传统机器学习模型,由于其准确性和计算效率的平衡,传统模型仍然具有竞争力。此外,定性分析揭示了虚假新闻文章中的模式。这项研究为未来旨在打击误导信息(尤其是有关选举过程的信息)的努力奠定了基础。我们公开提供了我们的标记数据和模型以供使用和可复制性检验。
Mar, 2024