自动检测虚假新闻的深度学习方法
本文聚焦于自动识别在线新闻中的虚假内容,首先介绍了用于虚假新闻检测的新颖数据集,描述了收集、注释和验证过程,并提供诸多在区分真实和虚假新闻语言差异方面的探索性分析。其次,本文开展了一系列学习实验以构建准确的虚假新闻检测器,并比较了手动和自动识别虚假新闻的结果。
Aug, 2017
本研究介绍了一种新的自动检测跨领域新闻中虚假消息的技术,该技术整合了领域特定和跨领域知识,并利用一种无监督的选择性注释技术来减少标注成本,并在跨领域的新闻数据集上实现了最先进的性能。
Feb, 2021
本文介绍了如何应用自然语言处理技术解决社交网络上的虚假新闻检测问题,并着重描述了该问题的挑战以及相关任务的形式、数据集和解决方案,并讨论了其潜力和局限性,并提出了更精细、详细、公平和实用的检测模型等研究方向。
Nov, 2018
我们使用自然语言处理方法对 1876 条新闻数据进行预处理,通过训练模型将假新闻和真实新闻进行分类,最终通过 Naive Bayes 分类器得出 56% 的准确率和平均 32% 的 F1-macro 得分。
Sep, 2023
提出了一个以理论驱动的模型,探索了假新闻在不同层次(词汇、句法、语义和话语)上的表现,并在监督式机器学习框架下进行了检测。在真实世界的两个数据集上的实验证明,该方法可以优于现有技术,并在内容信息有限的情况下实现假新闻的早期检测。
Apr, 2019
通过机器学习算法,在两个公开数据集上进行实验分析,研究了如何检测和区分真假新闻,结果表明采用了三种分类器:被动型侵略性、朴素贝叶斯和支持向量机,这种方法具有良好的性能表现。
Jan, 2022
本文介绍了 Fake News Challenge stage #1 (FNC-1) 数据集并概述了使用该数据集构建伪新闻检测系统的竞争尝试。通过使用不同的自然语言处理技术处理标题和正文文本,提取特征并使用软余弦相似性方法计算相似度。该系统使用深度学习方法进行分类,除了 “disagree” 类别外,其余类别均达到高准确性,最终分类准确率达到 84.6%,在该数据集上排名第二。
Oct, 2022
本文研究通过数据挖掘的角度对社交媒体上的假新闻进行自动检测,并用不同的文本分类算法在 Contraint@AAAI 2021 Covid-19 假新闻检测数据集上进行评估。通过使用卷积神经网络(CNN)、长短时记忆(LSTM)和双向编码器变换器(BERT)来进行分类,并评估了无标签 Covid 推文语料库中的无监督学习的重要性。最终结果在 Covid-19 假新闻检测数据集上表现出 98.41%的最佳准确性。
Jan, 2021
本文探讨了从在线社交网络中检测虚假新闻文章、制作者和主题的原则、方法和算法,并评估了相应性能,提出了 FAKEDETECTOR 自动虚假新闻可信度推断模型,通过从文本信息中提取的显性和潜在特征,构建了一个深度扩散网络模型,同时学习新闻文章、制作者和主题的表示。实验结果证明了所提出模型的有效性。
May, 2018