May, 2020

音视频不协调基于深度伪造检测与定位

TL;DR本文提出了一种基于模态不和谐度量(Modality Dissonance Score,MDS)的深度伪造视频检测算法,通过计算视频中音频和视觉段之间的差异得出 MDS,同时采用交叉熵和对比损失进行学习,并在 DFDC 和 DeepFake-TIMIT 数据集上的实验表明,该方法表现优于现有技术,还可以进行时间伪造定位,准确识别伪造视频段。