May, 2020
音视频不协调基于深度伪造检测与定位
Not made for each other- Audio-Visual Dissonance-based Deepfake Detection and Localization
Komal Chugh, Parul Gupta, Abhinav Dhall, Ramanathan Subramanian
TL;DR本文提出了一种基于模态不和谐度量(Modality Dissonance Score,MDS)的深度伪造视频检测算法,通过计算视频中音频和视觉段之间的差异得出 MDS,同时采用交叉熵和对比损失进行学习,并在 DFDC 和 DeepFake-TIMIT 数据集上的实验表明,该方法表现优于现有技术,还可以进行时间伪造定位,准确识别伪造视频段。