Jul, 2021

将 EfficientNet 和 Vision Transformers 相结合用于视频深度伪造检测

TL;DR本文旨在解决视频深度伪造检测的问题,特别注重于面部深度伪造,他们利用效率较高的特征提取器与各种 Vision Transformer 结合进行实验,得出的最佳模型 AUC 为 0.951,F1 得分为 88.0%.