Jul, 2023

FTFDNet:学习通过三模态交互检测人脸视频伪造

TL;DR基于 DeepFake 技术的数字面部伪造对公共媒体安全构成威胁,尤其是在使用口型操作生成说话人脸时,伪视频检测的难度进一步增加。本研究提出了一种利用视觉、音频和运动特征结合的跨模态融合模块的伪说话人脸检测网络(FTFDNet),并引进了一种新颖的音频 - 视频注意机制(AVAM),从而在已建立的伪说话人脸检测数据集(FTFDD)以及 DeepFake 视频检测数据集(DFDC 和 DF-TIMIT)上实现了比其他先进 DeepFake 视频检测方法更好的检测性能。