混合集成方法用于假新闻检测:一种尝试
提出了两种基于深度学习的模型,用于在多个领域的在线新闻内容中解决虚假新闻检测问题,并在 FakeNews AMT 和 Celebrity 两个数据集上评估,取得了很好的性能并超过了当前最先进的基于手工特征工程的系统。同时,进行了跨领域分析以探索系统在不同领域的适用性。
May, 2020
通过机器学习算法,在两个公开数据集上进行实验分析,研究了如何检测和区分真假新闻,结果表明采用了三种分类器:被动型侵略性、朴素贝叶斯和支持向量机,这种方法具有良好的性能表现。
Jan, 2022
我们使用自然语言处理方法对 1876 条新闻数据进行预处理,通过训练模型将假新闻和真实新闻进行分类,最终通过 Naive Bayes 分类器得出 56% 的准确率和平均 32% 的 F1-macro 得分。
Sep, 2023
本文研究通过数据挖掘的角度对社交媒体上的假新闻进行自动检测,并用不同的文本分类算法在 Contraint@AAAI 2021 Covid-19 假新闻检测数据集上进行评估。通过使用卷积神经网络(CNN)、长短时记忆(LSTM)和双向编码器变换器(BERT)来进行分类,并评估了无标签 Covid 推文语料库中的无监督学习的重要性。最终结果在 Covid-19 假新闻检测数据集上表现出 98.41%的最佳准确性。
Jan, 2021
本文介绍了 Fake News Challenge stage #1 (FNC-1) 数据集并概述了使用该数据集构建伪新闻检测系统的竞争尝试。通过使用不同的自然语言处理技术处理标题和正文文本,提取特征并使用软余弦相似性方法计算相似度。该系统使用深度学习方法进行分类,除了 “disagree” 类别外,其余类别均达到高准确性,最终分类准确率达到 84.6%,在该数据集上排名第二。
Oct, 2022
本文提出一种利用卷积神经网络和长短期循环神经网络模型的混合方法,从 Twitter 帖子中检测和分类假新闻信息的框架,精度可达 82%。该方法能够直观地识别假新闻故事的相关特征而无需领域知识。
Jun, 2018
本文介绍了如何应用自然语言处理技术解决社交网络上的虚假新闻检测问题,并着重描述了该问题的挑战以及相关任务的形式、数据集和解决方案,并讨论了其潜力和局限性,并提出了更精细、详细、公平和实用的检测模型等研究方向。
Nov, 2018
该研究综述了自然语言处理中混合和集成深度学习模型的广泛探索,揭示了它们在情感分析、实体识别、机器翻译、问答、文本分类、生成、语音识别、摘要生成和语言建模等多种任务中具有的变革潜力。研究系统地介绍了每个任务,从循环神经网络 (RNNs) 到基于 Transformer 的模型如 BERT,阐述了它们的性能、挑战和计算需求。强调了集成技术的适应性,突出了它们增强各种自然语言处理应用的能力。还讨论了在实施过程中的挑战,包括计算负载、过拟合和模型解释复杂性,以及解释性和性能之间的权衡。作为精炼而宝贵的指南,该综述综合了有关任务、模型结构和挑战的见解,为研究人员和从事自然语言处理的从业者提供了一个综合的视角,以通过集成深度学习在自然语言处理中推进基于语言的应用。
Dec, 2023
本文探讨了现有的假新闻检测方法存在的问题,并提出加入事实核查与语言分析相结合的方法,以应对新闻篡改攻击和真实新闻被误判的情况。作者提出采用众包知识图谱解决新闻事件事实搜集的问题。
Jan, 2019