卷积神经网络与 Transformer 在深度学习中的 Deepfake 侦测
本文提出了一种使用卷积视觉 Transformer 及卷积神经网络架构用于检测 Deepfakes 的方法,并在 DeepFake Detection Challenge Dataset 上进行了实验,取得了 91.5%的准确度、0.91 的 AUC 值和 0.32 的损失值。
Feb, 2021
本研究通过对监督和自监督模型进行全面的比较分析,评估了八种监督深度学习架构和两种基于转化器的使用自监督策略(DINO,CLIP)进行预训练的模型在四个基准数据集上的性能,同时还研究了模型大小和性能之间的权衡,以提供关于不同深度学习架构、训练策略和深度伪造检测基准的效果的见解,促进更准确可靠的深度伪造检测系统的发展,从而在减轻深伪造对个人和社会的有害影响方面起到重要作用。
Aug, 2023
本文旨在解决视频深度伪造检测的问题,特别注重于面部深度伪造,他们利用效率较高的特征提取器与各种 Vision Transformer 结合进行实验,得出的最佳模型 AUC 为 0.951,F1 得分为 88.0%.
Jul, 2021
该论文提出了一种基于卷积变换器的深度模型,旨在提高 Deepfake 检测性能,通过整合图片的局部和全局信息,采用卷积池化和再关注机制来增强特征提取、提升效率,并利用图像关键帧进行模型训练以提高性能,提出的解决方案在多个 Deepfake 基准数据集上均优于现有的基准算法。
Sep, 2022
通过使用卷积神经网络和胶囊网络与长短期记忆,利用可解释的人工智能来区分深度伪造生成的帧和原始帧,以实现我们的目标,并促进透明的人工智能关系并提供真实场景的实际示例。
Apr, 2024
本研究使用深度强化学习与卷积神经网络相结合,设计了一种新的深度伪造检测算法,通过统计每张测试图像的各种增强方法的分类分数来检测深度伪造的图片,实验证明该方法在跨数据集的泛化性能方面优于现有的模型,并获得最先进的性能。
Apr, 2022
通过引入卷积 LSTM 残差网络(CLRNet)并探索深度伪造(DeepFake)中的时空信息,我们提出了一种更通用的方法来检测由多种方法产生的深度伪造,包括 DeepFake-in-the-Wild(DFW),此方法在多个基准数据集上表现良好并进行了评估。
May, 2021
本文提出了一个名为 “GenConViT” 的模型,该模型结合了 ConvNeXt 和 Swin Transformer 模型进行特征提取,并利用自编码器和变分自编码器从潜在数据分布中进行学习,从而在检测各种深度伪造视频方面取得了较好的性能。GenConViT 模型的平均准确度为 95.8%,测试数据集上的 AUC 值为 99.3%,能够有效地解决深度伪造检测中的泛化性挑战。
Jul, 2023
本文提出了一种有效的方法来评估 DeepFake 视频的视觉真实感,并详细介绍了两个卷积神经网络模型的数据预处理和训练程序,这些模型通过从帧序列中提取的特征来预测 DeepFake 视频的 Mean Opinion Scores,并在 DeepFake Game Competition (DFGC) 2022 评估中获得了第三名。
Jun, 2023