卷积神经网络与 Transformer 在深度学习中的 Deepfake 侦测

Apr, 2023

卷积神经网络与 Transformer 在深度学习中的 Deepfake 侦测

Deepfake Detection with Deep Learning: Convolutional Neural Networks versus Transformers

Vrizlynn L. L. Thing

TL;DR本文研究深度学习架构 (CNNs 和 Transformers) 的演进，设计和开发了深度伪造检测模型，并在深度伪造数据集上进行了实验，取得了较高的准确率和 AUC，并分析了不同深度伪造数据集之间的关系。

Abstract

The rapid evolvement of deepfake creation technologies is seriously threating media information trustworthiness. The consequences impacting targeted individuals and institutions can be dire. In this work, we study the evolutions of deep learning architectures, particularly cnns and

deepfake detection cnns transformers datasets accuracy

发现论文，激发创造

卷积视觉转换器用于深度伪造视频检测

本文提出了一种使用卷积视觉 Transformer 及卷积神经网络架构用于检测 Deepfakes 的方法，并在 DeepFake Detection Challenge Dataset 上进行了实验，取得了 91.5％的准确度、0.91 的 AUC 值和 0.32 的损失值。

Feb, 2021

深度伪造视频检测：一项比较分析

本研究通过对监督和自监督模型进行全面的比较分析，评估了八种监督深度学习架构和两种基于转化器的使用自监督策略（DINO，CLIP）进行预训练的模型在四个基准数据集上的性能，同时还研究了模型大小和性能之间的权衡，以提供关于不同深度学习架构、训练策略和深度伪造检测基准的效果的见解，促进更准确可靠的深度伪造检测系统的发展，从而在减轻深伪造对个人和社会的有害影响方面起到重要作用。

Aug, 2023

利用深度学习方法进行深度伪造检测：综述

本论文旨在探讨不同的方法学以实现具有更高准确度的低成本模型，以检测 Deepfake，并解决数据集的泛化问题。

Apr, 2023

将 EfficientNet 和 Vision Transformers 相结合用于视频深度伪造检测

本文旨在解决视频深度伪造检测的问题，特别注重于面部深度伪造，他们利用效率较高的特征提取器与各种 Vision Transformer 结合进行实验，得出的最佳模型 AUC 为 0.951，F1 得分为 88.0％.

Jul, 2021

深度卷积池化变压器用于深度伪造检测

该论文提出了一种基于卷积变换器的深度模型，旨在提高 Deepfake 检测性能，通过整合图片的局部和全局信息，采用卷积池化和再关注机制来增强特征提取、提升效率，并利用图像关键帧进行模型训练以提高性能，提出的解决方案在多个 Deepfake 基准数据集上均优于现有的基准算法。

Sep, 2022

使用卷积神经网络和胶囊网络进行可解释的深度伪造视频检测

通过使用卷积神经网络和胶囊网络与长短期记忆，利用可解释的人工智能来区分深度伪造生成的帧和原始帧，以实现我们的目标，并促进透明的人工智能关系并提供真实场景的实际示例。

Apr, 2024

提高深假脸检测器的跨数据集泛化能力

本研究使用深度强化学习与卷积神经网络相结合，设计了一种新的深度伪造检测算法，通过统计每张测试图像的各种增强方法的分类分数来检测深度伪造的图片，实验证明该方法在跨数据集的泛化性能方面优于现有的模型，并获得最先进的性能。

Apr, 2022

一款探测器，称霸所有：通向通用深度伪装攻击检测框架

通过引入卷积 LSTM 残差网络（CLRNet）并探索深度伪造（DeepFake）中的时空信息，我们提出了一种更通用的方法来检测由多种方法产生的深度伪造，包括 DeepFake-in-the-Wild（DFW），此方法在多个基准数据集上表现良好并进行了评估。

May, 2021

使用生成卷积视觉转换器进行 Deepfake 视频检测

本文提出了一个名为 “GenConViT” 的模型，该模型结合了 ConvNeXt 和 Swin Transformer 模型进行特征提取，并利用自编码器和变分自编码器从潜在数据分布中进行学习，从而在检测各种深度伪造视频方面取得了较好的性能。GenConViT 模型的平均准确度为 95.8％，测试数据集上的 AUC 值为 99.3％，能够有效地解决深度伪造检测中的泛化性挑战。

Jul, 2023

超越检测：深度伪造图像视觉真实度评估

本文提出了一种有效的方法来评估 DeepFake 视频的视觉真实感，并详细介绍了两个卷积神经网络模型的数据预处理和训练程序，这些模型通过从帧序列中提取的特征来预测 DeepFake 视频的 Mean Opinion Scores，并在 DeepFake Game Competition (DFGC) 2022 评估中获得了第三名。

Jun, 2023