训练事实验证器的方法:多模态开放模型的知识传递
对多模态大型语言模型在事实检查方面的能力和局限性进行了系统评估,发现 GPT-4V 在识别恶意和误导性多模态论断方面表现出优越性能,具备解释不合理方面和潜在动机的能力,同时已有的开源模型存在强烈的偏见,并对提示非常敏感。这项研究为对抗虚假多模态信息和构建安全可靠的多模态模型提供了启示,据我们所知,这是第一次对多模态大型语言模型进行真实世界事实检查的评估。
Mar, 2024
本文描述了我们在 2022 AAAI 多模态事实验证(Factify)挑战上的参与系统。 我们处理该挑战为多模态蕴含任务,作为多类分类,并提出并探索了两种基线方法,包括集成模型和多模态注意力网络。 我们在此工作中测试了不同 SoTA 预训练变换器和视觉模型。 最佳模型在排行榜中排名第一, 平均 F - 度量值为 0.77。 最后,我们强调了未来研究的任务和多模态数据集的挑战。
Dec, 2021
为解决社交媒体上大规模的多模态虚假信息检测问题,我们介绍了一个名为 FACTIFY 3M 的数据集,包含了 3 百万个样本,其中包括文本声明、图像、像素级图像热力图和 5W 问答对等元素,并且提供了可解释性的概念。
May, 2023
本文介绍了我们的方法,针对多模式信息传播中的虚假新闻进行了自动化的网络谣言 / 虚假信息检测,最终我们在 De-Factify@AAAI2022 FACTIFY 机器学习竞赛中获得了第四名,F1-score 为 74.807%。
Jan, 2022
社交媒体的迅速增长导致虚假新闻泛滥,因此自动检测和验证虚假信息的研究变得尤为重要。本研究介绍了 Factify 2 任务的结果,提供了一个多模态事实验证和讽刺新闻数据集,并使用基于多模态关系将社交媒体索求与支持文件进行比较,最终得到 81.82% 的最高 F1 分数。
Jul, 2023
我们提出了一种端到端的多模态事实核查和解释生成方法,利用包括文章、图片、视频以及推特在内的大量网络资源来评估索赔的真实性,并生成一个有理化陈述来解释推理和裁定过程。我们构建了 Mocheg,这是一个大规模数据集,包括 21,184 个索赔和 58,523 条文本和图像形式的证据。我们在多模态证据检索、索赔验证和解释生成三个子任务上进行了几种最先进的神经网络结构的实验,以建立基准性能,并展示端到端多模态事实核查的最新性能仍然远远不够令人满意。据我们所知,我们是第一个建立端到端多模态事实核查和证明基准数据集和解决方案的研究团队。
May, 2022
本文研究如何使用现有数据集训练 Twitter 消息的不同语言的验证价值模型。通过使用多语言 BERT 模型,我们系统地比较了六种方法。结果表明,对于一些语言对,零 - shot 跨语言转移是可能的,并且可以与在目标语言上训练的单语模型一样好。
Nov, 2022
本研究提供 FACTIFY2 这一多模态事实核查数据集以及相关算法,并使用新数据源和添加讽刺文章来改进 FACTIFY1,FACTIFY2 具有 50,000 个新实例数据,包含支持、无证据和驳斥三个分类以及文本和视觉数据的三个子分类,使用基于 BERT 和 Vision Transformer 的基础模型的测试集 F1 分数为 65%。
Apr, 2023
本文介绍了我们在 AAAI2023 的多模态事实验证(FACTIFY)挑战中的方法。我们提出了一个基于结构一致性的多模态事实验证方案来分类虚假新闻,通过随机森林分类器将特征进行合并并获得了 0.8079 的加权平均 F1 分数。
Mar, 2023
本文提出了一种基于 BERT 模型的句子级多任务学习模型,可用于事实验证任务,并通过联合训练模型的理由选择和态度预测来实现反击社交媒体或新闻网站上不断传播的错误信息的目的。
Dec, 2020