通向未来的泛化:缓解假新闻检测中的实体偏见
社交媒体上的虚假新闻检测方法缺乏鲁棒性且无法推广到未知事件,为解决这一问题,该研究提出了一种面向未来事件的虚假新闻检测框架,通过自适应增强策略和图对比学习训练目标预测器,同时独立训练事件预测器并通过减去事件预测器的输出从而缓解事件偏见,实验证明了该方法在真实社交媒体环境下相对于现有的先进方法的有效性。
Feb, 2024
本研究提出了一种名为 “FTT” 的有效框架,可以预测新闻数据的时间分布模式并指导检测器快速适应未来的分布。在真实世界的时序数据集上的实验证明了我们所提出的框架的优越性。
Jun, 2023
本文围绕多模态虚假新闻检测问题,提出了一种新的提取多模态线索的框架,该框架能够充分地考虑图像文本的三种关系,并在实验证明其优于现有文献的方法。
Aug, 2021
本文探讨了现有的假新闻检测方法存在的问题,并提出加入事实核查与语言分析相结合的方法,以应对新闻篡改攻击和真实新闻被误判的情况。作者提出采用众包知识图谱解决新闻事件事实搜集的问题。
Jan, 2019
本文研究了大型语言模型时代中的假新闻检测问题,发现仅训练于人工编写文章的检测器在检测机器生成的假新闻方面表现良好,但反之不成立。此外,由于检测器对机器生成的文本存在偏见,需要在训练集中使用比测试集中较低比例的机器生成新闻。基于我们的发现,我们提供了一个实用的策略来开发健壮的假新闻检测器。
Nov, 2023
提出了两种基于深度学习的模型,用于在多个领域的在线新闻内容中解决虚假新闻检测问题,并在 FakeNews AMT 和 Celebrity 两个数据集上评估,取得了很好的性能并超过了当前最先进的基于手工特征工程的系统。同时,进行了跨领域分析以探索系统在不同领域的适用性。
May, 2020
该研究提出了一种基于神经网络的检测器,利用图卷积神经网络和新闻文章中的文本信息来探究文章提到的事实,以区分人工编写的新闻文章和通过对实体进行事实不正确的替换而生成的文章。研究者使用了多种策略生成新实体替换,包括使用 GPT-2 生成。该模型在所有设置中的准确性均达到或超过了最先进的检测器。
Mar, 2022
本文介绍了一种有效的防御机制,其可以用于防御包括图像和标题在内的机器生成的虚假新闻,并通过创建一个包含 4 种不同类型的生成文章的 NeuralNews 数据集以及进行一系列基于此数据集的人类用户研究实验来确定敌方可能会利用的潜在弱点。此外,本文提供了一种相对有效的方法,基于检测视觉语义不一致性的方法,这将成为有效的第一防线和未来防御机器生成的虚假信息的有用参考资料。
Sep, 2020
本文提出了三种基于多模态 transformer 的假新闻检测模型,并通过深入分析操纵数据的方法来探索这些模型在社交媒体上实际使用情况下的性能。研究发现,这些系统在面临被操纵的数据时会出现显著性能下降。为了减少偏差并改善模型的推广能力,本文建议使用数据增强技术对社交媒体上的假新闻检测进行更有意义的实验。所提出的数据增强技术使得模型的泛化能力得到了提高,并获得了最先进的效果。
May, 2023
我们使用自然语言处理方法对 1876 条新闻数据进行预处理,通过训练模型将假新闻和真实新闻进行分类,最终通过 Naive Bayes 分类器得出 56% 的准确率和平均 32% 的 F1-macro 得分。
Sep, 2023