基于深度学习的假新闻检测的多策略框架
本研究介绍了Liar数据集以及一种新型卷积神经网络,该网络能够结合元数据和文本进行表面级别的自动虚假新闻检测,这个可用于事实核查,工具使得这种检测基于事实上的文章变得更容易,从而减少虚假信息带来的实际影响。
May, 2017
本文研究了基于文本和图像信息的卷积神经网络TI-CNN,通过提取虚假新闻中的显式和潜在特征,将文本和图像信息投影到统一特征空间中进行训练,以此来解决自动检测虚假新闻的问题。
Jun, 2018
通过对 fact-checkers 的语言特征进行分析和提出建议,使用基于深度学习的文本生成框架来生成可以提高辨别信息真假的参与度的回复,提高了辨别真假信息的准确度。
Oct, 2019
提出了两种基于深度学习的模型,用于在多个领域的在线新闻内容中解决虚假新闻检测问题,并在FakeNews AMT和Celebrity两个数据集上评估,取得了很好的性能并超过了当前最先进的基于手工特征工程的系统。同时,进行了跨领域分析以探索系统在不同领域的适用性。
May, 2020
这篇研究通过多种神经和非神经预处理以及风格转移技术,消除了假新闻检测模型中情感、情绪、词性等易受攻击的指标,从而推断出这些模型中可能隐藏着可操纵的信号,并通过情感向量模型构建进一步证明了这一假设。
Apr, 2022
本研究开发了一个深度概率模型,该模型使用一个变分自动编码器和双向LSTM网络的密集文本表示与从贝叶斯混合模型中推断出的语义主题相关特征,旨在使用可解释的特征和方法检测真假新闻,实验证明该方法实现了与现有方法可比较的性能。
Sep, 2022
本文介绍了Fake News Challenge stage #1 (FNC-1)数据集并概述了使用该数据集构建伪新闻检测系统的竞争尝试。通过使用不同的自然语言处理技术处理标题和正文文本,提取特征并使用软余弦相似性方法计算相似度。该系统使用深度学习方法进行分类,除了“disagree”类别外,其余类别均达到高准确性,最终分类准确率达到84.6%,在该数据集上排名第二。
Oct, 2022
基于大型语言模型的虚假新闻检测研究发现,大型语言模型虽然能提供多元的合理解释,却无法像基于小语言模型的训练过程那样适当选择和结合解释来得出结论。因此,当前的大型语言模型不能替代小型语言模型在虚假新闻检测中的作用,但可以作为小型语言模型的顾问,提供多元的启示性解释。为了实现这一点,作者设计了自适应启示指导网络(ARG)用于虚假新闻检测,在这个网络中,小型语言模型从大型语言模型的解释中选择性地获取新闻分析的见解。另外,作者还提出了一个消除解释的版本ARG-D,用于成本敏感的情境,无需查询大型语言模型。实验证明,ARG和ARG-D在两个真实数据集上的表现优于基于小型语言模型、大型语言模型以及小型和大型语言模型组合的三种基准方法。
Sep, 2023
通过扩充大语言模型(ChatGPT)的事实核查,重新审视了由人类记者验证的现有虚假新闻数据集,并将扩充的虚假新闻数据集命名为ChatGPT-FC。我们在评估新闻主题可信度、新闻创作者可信度、时态敏感度和政治框架方面定量分析了人类记者和LLM之间的差异和相似之处。我们的研究结果强调了LLM作为初步筛选方法的潜力,为减轻人类记者的固有偏见并增强虚假新闻检测提供了有希望的途径。
Dec, 2023
研究通过对比分析,评估了不同大型和小型LLMs在识别和过滤假新闻内容方面的有效性,并利用Kaggle的假新闻数据集样本探讨了当前LLMs在假新闻检测方面的能力和局限性,同时讨论了提高AI驱动信息完整性对开发人员和决策者的影响。
Jun, 2024