Jul, 2023

使用生成卷积视觉转换器进行 Deepfake 视频检测

TL;DR本文提出了一个名为 “GenConViT” 的模型,该模型结合了 ConvNeXt 和 Swin Transformer 模型进行特征提取,并利用自编码器和变分自编码器从潜在数据分布中进行学习,从而在检测各种深度伪造视频方面取得了较好的性能。GenConViT 模型的平均准确度为 95.8%,测试数据集上的 AUC 值为 99.3%,能够有效地解决深度伪造检测中的泛化性挑战。