- 用于增强深度伪造检测的掩码条件扩散模型
本研究提出一种基于扩散模型的数据增强方法,通过生成多样化的伪造人脸图像,帮助提升深度伪造检测模型的性能。实验证明,所采用方法生成的伪造图像质量高,并能有效改善深度伪造检测模型的性能。
- 深度伪造检测中的常识推理
利用人们的常识推理对深度学习伪造进行检测,并通过 DD-VQA 任务扩展,以建模解释图像真伪的原因,提供了一个包含回答和解释的新数据集,并提出了一种基于视觉和语言的 Transformer 框架,用于解释性和跨模态的应用于深度伪造检测领域。
- 嘴唇说谎:识别唇同步 DeepFakes 中音频和视觉之间的时间不一致
我们提出了一种新颖的方法,通过利用嘴唇运动和音频信号之间的不一致性,以及模拟嘴唇和头部区域之间的生物联系来进行唇诈骗识别,实验证明我们的方法在发现唇同步视频方面的平均准确率超过 95.3%,明显优于基准方法。这项研究在现实世界场景中取得了高 - LAA-Net:用于高质量 Deepfakes 检测的局部伪影注意力网络
介绍了一种名为局部化伪造关注网络(LAA-Net)的用于高质量深度伪造检测的新方法,该方法通过明确的关注机制以及简单有效的升级特征金字塔网络(E-FPN)来提高检测性能。
- Delocate:随机定位篡改痕迹的 Deepfake 视频检测和定位
提出了一种名为 Delocate 的新型深度伪造检测模型,它能够识别和定位未知领域的深度伪造视频,通过恢复和定位两个阶段的方法,对于面部伪造区域的定位表现出较好的效果,并在跨领域检测性能上有所提升。
- 揭示口型不一致的唇同步深度伪造技术
本文描述了一种基于口腔不一致性(LIPINC)的新方法来检测唇同步深度伪造视频,通过识别口腔区域的时间不一致性,可以成功捕捉到这些不规则,相比现有的方法,在多个基准深度伪造数据集上表现更好。
- 领域取证:通过双向适应揭示跨领域的人脸伪造
通过无监督领域自适应的新解决方案,DomainForensics,从已知伪造品向新伪造品传递伪造知识,通过领域差异的对齐捕捉新伪造品的知识,既考虑前向适应也考虑后向适应,在前向适应中,通过有监督训练在已知伪造品中提升 DeepFake 检测 - 重新思考卷积神经网络生成网络中的上采样操作,用于可泛化的深度伪造检测
通过对 CNN-based generator 架构的重新思考,揭示图像上采样操作产生的综合伪造图像中的伪造性特征,进而建立了合成伪造特征的广义表示。在开放世界数据集上的综合分析表明,本研究在现有方法上取得了 12.8% 的显著改进。
- 利用双神经网络操作的个性化深伪检测
通过使用有关个体公众人物身份的信息,利用神经网络的幂等性属性,我们提出了一种改进深度伪造图像检测方法,并使用自行策划的包含 45 个公众人物的数据集进行实验,结果表明方法有效性提高,检测性能提高了,AUC 值从 0.92 提高到 0.94, - DeepFidelity:深伪造:感知伪造保真度评估用于深度假脸检测
DeepFidelity 和 SSAAFormer 是一种新的深度伪造检测框架和网络结构,能够自适应地区分具有不同图像质量的真实和伪造人脸图像,并在多个基准数据集上展现出优势。
- AV-Deepfake1M:大规模基于 LLM 的视听深度伪造数据集
本研究针对高度逼真的深度伪造音视频内容的检测和定位问题提出了 AV-Deepfake1M 数据集,并通过全面的描述和严格的数据质量分析,使用先进的深度伪造检测和定位方法进行了综合基准测试,结果显示与之前数据集相比性能大幅下降。该数据集将在构 - 揭示可普遍适用的深伪冒检测中的常见不一致性
我们提出了一种基于帧不一致性的检测方法,通过捕捉真假视频之间普遍存在的不一致性来区分跨多个领域的真实和伪造视频的时域一致性,实验证明了我们方法在未见过的 Deepfake 领域具有泛化能力。
- 超越造假特异性的潜在空间增强用于通用深度伪造检测
通过扩充潜在空间中的伪造特征的变化和模拟,在改善深假检测器过拟合的同时,实现了更加泛化的决策边界,从而使得所提出的方法在多个广泛使用的基准测试中超越了现有技术。
- 通过注视引导的空间不一致学习进行深度伪造检测
本文介绍了一种创新的 DeepFake 检测方法,使用从 3D 凝视估计模型获取的凝视表示来规范我们 DeepFake 检测模型中的相应表示,同时结合一般特征进一步提高性能。实验证明我们提出的 GazeForensics 优于当前最先进的方 - 扩散生成图像中的弱监督深度伪造定位
通过使用基于解释、局部分数或注意机制的三种方法,并利用 Xception 网络作为共同的骨干架构,我们将任务定为弱监督定位问题,并在方法选择、监督类型、数据集和生成器等方面进行了仔细分析;我们的研究通过构建数据集,其中只有一个组件发生变化, - AntifakePrompt: 基于提示调整的视觉语言模型用于检测假图像
利用视觉 - 语言模型和提示调整技术,将深度伪造检测问题转化为视觉问题回答,实验表明通过预训练的视觉 - 语言模型和提示调整可以显著提高深度伪造检测的准确性。
- 深度假像检测:利用 2D 和 3D CNN 集成的能力
该研究使用 2D 和 3D 卷积神经网络的创新方法验证视频内容,结合滑动过滤器捕捉空时特征,利用 Voting Ensembles 和 Adaptive Weighted Ensembling 优化 3D 模型输出,在对抗深度伪造生成的欺骗 - 基于精细特征的面部伪造深伪视频检测
本文提出了一种基于显示抑制背景噪声和学习多尺度可区分特征的方法,将人脸伪造检测问题归纳为细粒度分类问题,并在不同数据集和伪造技术的实验场景中实验证明了方法的优越性。
- 整合视听特征用于多模态深度伪造检测
深度伪造是通过人工智能生成的媒体,其中图像或视频经过数字修改。本研究提出了一种基于音视频的深度伪造检测方法,将细粒度的深度伪造识别与二元分类结合,增强了在域内和跨域测试下的检测能力。
- 其他计算机视觉任务与深度伪造检测的接近程度如何?
在这篇论文中,我们质疑传统的观点,即在深度伪造检测中,经过监督训练的 ImageNet 模型具有强大的泛化能力并适用于作为特征提取器。我们提出了一种新的度量方法,称为 “模型可分离性”,用于以一种无监督的方式视觉与定量地评估模型分离数据的能