为了应对每天都暴露在误导性和宣传性新闻文章和媒体帖子中的在线用户,我们提出了一种检测和展示这些技术的方法,以提供可解释性。特别地,我们定义了定性描述性特征,并分析了它们检测欺骗技术的适用性,同时表明我们的可解释性特征可以与预训练语言模型轻松结合,产生最先进的结果。
Aug, 2021
本文聚焦于自动识别在线新闻中的虚假内容,首先介绍了用于虚假新闻检测的新颖数据集,描述了收集、注释和验证过程,并提供诸多在区分真实和虚假新闻语言差异方面的探索性分析。其次,本文开展了一系列学习实验以构建准确的虚假新闻检测器,并比较了手动和自动识别虚假新闻的结果。
Aug, 2017
本文介绍了一种有效的防御机制,其可以用于防御包括图像和标题在内的机器生成的虚假新闻,并通过创建一个包含 4 种不同类型的生成文章的 NeuralNews 数据集以及进行一系列基于此数据集的人类用户研究实验来确定敌方可能会利用的潜在弱点。此外,本文提供了一种相对有效的方法,基于检测视觉语义不一致性的方法,这将成为有效的第一防线和未来防御机器生成的虚假信息的有用参考资料。
Sep, 2020
本文探讨了现有的假新闻检测方法存在的问题,并提出加入事实核查与语言分析相结合的方法,以应对新闻篡改攻击和真实新闻被误判的情况。作者提出采用众包知识图谱解决新闻事件事实搜集的问题。
Jan, 2019
本文中介绍了一种使用语言和 web 标记功能来识别虚假新闻页面的议题不可知(TAG)分类策略,经过实验验证,其分类精度较高。
May, 2019
通过使用以 2022 年法国总统选举为中心的推特信息集,本文提出了一种用于检测社交媒体上特定议程控制实例的方法,该方法适用于注释数据有限或不存在的情况,并通过评估不同方法和技术的全面性展示了其可行性,证明将任务视为文本蕴涵问题可以克服对大规模注释训练数据集的需求。
May, 2024
该研究基于卷积神经网络开发了一个标题分类器,主要通过调查标题的词语分割、词性标注和情感特征等关键因素,以确定新闻文章的可信度,并将这些特征集成到分类模型中。经过实验证明,该模型的准确度可达到 93.99%。
Apr, 2022
本研究通过重新定义问题、识别模糊和具有误导性的标题,并利用类序贯规则和共同训练的方法,成功筛选出来自不同来源的不准确标题,并进行数据分析。
May, 2017
本论文提出了一种利用真实新闻和 POS 标注生成阿拉伯语虚假新闻的新方法,并开发了第一届阿拉伯语虚假新闻检测模型,该模型通过使用基于 AraNews 的生成式新闻实现了最新的 F1=70.06 的结果,所有研究中使用的数据和模型都是公开可用的。
Nov, 2020
该论文提出了一个在社交媒体上识别新闻信息操纵的新任务,介绍了他们的数据收集方案和数据集 “ManiTweet”,并发现这是一项具有挑战性的任务,基于大型语言模型的表现仍然不尽完美。他们提出的简单且有效的基本模型在 ManiTweet 数据集上表现优异。此外,在一些人类编写的推文的探索性分析中揭示了有关信息操纵与新闻文章领域和事实性之间的有趣联系,并发现操纵的句子更有可能包含主要故事或后果。
May, 2023