学习分层话语级结构用于假新闻检测
本文聚焦于自动识别在线新闻中的虚假内容,首先介绍了用于虚假新闻检测的新颖数据集,描述了收集、注释和验证过程,并提供诸多在区分真实和虚假新闻语言差异方面的探索性分析。其次,本文开展了一系列学习实验以构建准确的虚假新闻检测器,并比较了手动和自动识别虚假新闻的结果。
Aug, 2017
提出了一个以理论驱动的模型,探索了假新闻在不同层次(词汇、句法、语义和话语)上的表现,并在监督式机器学习框架下进行了检测。在真实世界的两个数据集上的实验证明,该方法可以优于现有技术,并在内容信息有限的情况下实现假新闻的早期检测。
Apr, 2019
本研究介绍了一种新的自动检测跨领域新闻中虚假消息的技术,该技术整合了领域特定和跨领域知识,并利用一种无监督的选择性注释技术来减少标注成本,并在跨领域的新闻数据集上实现了最先进的性能。
Feb, 2021
本文研究了机器学习技术在检测假新闻上的运用,并着重探讨了噪声对其性能的影响,文章采用BiLSTM为基础的结构模型方法,对Karimi和Tang的Hierarchical Discourse-level Structure for Fake News Detection进行了研究。
Jan, 2022
提出一种利用自我批评序列训练和宣传技巧生成更接近人类写作的文章,并创建了一份新的虚假新闻检测训练数据集PropaNews,结果表明,使用PropaNews训练的检测器比使用现有方法生成的数据训练的检测器在检测人类撰写的虚假信息方面的准确性提高了7.3%至12.0%。
Mar, 2022
本文介绍了一种基于Elementary Discourse Unit的多层次感知模型(EDU4FD)来改善文本表示,其中包括序列和图形的EDU表示。 这两种EDU表示被结合为增强的文本表示,以识别并有效感知假新闻。 通过实验表明,使用该模型可优于现有基于文本的方法。
May, 2022
提出利用分层递归神经网络进行假新闻的分类,通过学习新闻语言风格识别真假,第一次使用分层语言树和神经网络来辨别新闻真实性,实验结果表明该方法有效,并可以优于现有技术。
Jan, 2023
本文研究了大型语言模型时代中的假新闻检测问题,发现仅训练于人工编写文章的检测器在检测机器生成的假新闻方面表现良好,但反之不成立。此外,由于检测器对机器生成的文本存在偏见,需要在训练集中使用比测试集中较低比例的机器生成新闻。基于我们的发现,我们提供了一个实用的策略来开发健壮的假新闻检测器。
Nov, 2023
Few-Shot Fake News Detection using a Dual-perspective Augmented Model to enhance Large Language Models by identifying keywords, retrieving valuable information, and deriving the final result through multiple prediction modules.
Jul, 2024
通过设计一个简单但有效的结构对抗网络框架(SAN),从可用的传播数据中学习可迁移特征,以增强仅包含内容样本的检测能力,解决了在没有传播数据的情况下检测内容样本的冷启动虚假新闻检测任务的挑战,并且经过定性和定量实验证明了该框架的有效性。
Jul, 2024