MalFake: 基于循环神经网络和 VGG-16 的马拉雅拉姆语多模态假新闻鉴别
使用机器学习分类模型是打击假新闻传播的有效方法,但缺乏有效的全面数据集一直是假新闻研究和检测模型发展的问题。Fakeddit 是一个新颖的多模态数据集,包括一百万个多个类别的假新闻样本,并通过远程监督进行两种,三种和六种分类。我们构建了混合文本 + 图像模型并进行了多个变体的分类实验,证明了 Fakeddits 的多模式和精细分类的重要性。
Nov, 2019
本文提出了三种基于多模态 transformer 的假新闻检测模型,并通过深入分析操纵数据的方法来探索这些模型在社交媒体上实际使用情况下的性能。研究发现,这些系统在面临被操纵的数据时会出现显著性能下降。为了减少偏差并改善模型的推广能力,本文建议使用数据增强技术对社交媒体上的假新闻检测进行更有意义的实验。所提出的数据增强技术使得模型的泛化能力得到了提高,并获得了最先进的效果。
May, 2023
本文针对多媒体假新闻检测方法鲁棒性差的问题,提出了一种系统的鲁棒性评估方法,并通过 5 种对抗攻击和 2 种后门攻击实验验证,结果表明通过防御机制可以提高多模式检测器的鲁棒性。
Jun, 2022
本研究提出了一种基于终身学习和多语言知识转移的新型假新闻检测方法,该方法利用传统特征提取器和深度自然语言处理模型结合多层感知器分类器,可以在英语和西班牙语数据集上提高假新闻分类任务的性能。
May, 2022
本文通过系统研究最新扩散模型生成的虚假图片的真实性,分析其图像的低层特征和用作种子的文本说明的语义作用,并提供了一个新的包含约 600k 张图像的数据集 COCOFake。
Apr, 2023
社交媒体的迅速增长导致虚假新闻泛滥,因此自动检测和验证虚假信息的研究变得尤为重要。本研究介绍了 Factify 2 任务的结果,提供了一个多模态事实验证和讽刺新闻数据集,并使用基于多模态关系将社交媒体索求与支持文件进行比较,最终得到 81.82% 的最高 F1 分数。
Jul, 2023
本文介绍了一种有效的防御机制,其可以用于防御包括图像和标题在内的机器生成的虚假新闻,并通过创建一个包含 4 种不同类型的生成文章的 NeuralNews 数据集以及进行一系列基于此数据集的人类用户研究实验来确定敌方可能会利用的潜在弱点。此外,本文提供了一种相对有效的方法,基于检测视觉语义不一致性的方法,这将成为有效的第一防线和未来防御机器生成的虚假信息的有用参考资料。
Sep, 2020
本文提出了一种名为 Multi-domain Visual Neural Network (MVNN) 的框架,该框架将频率和像素域的视觉信息融合起来用于检测假新闻图像。在真实数据集上的实验表明,MVNN 比现有方法至少提高了 9.2% 的准确度,并可帮助提高超过 5.2% 的多模态假新闻检测性能。
Aug, 2019
该研究提出了使用多语言证据的多元宇宙特征用于较好的矫正和预测假新闻,并进行了对真假新闻自动实验的对比研究,结果显示该特征与语言特征的结合可以显著地提高假新闻的分类准确率。
Nov, 2022