BriefGPT.xyz
Ask
alpha
关键词
multimodal manipulations
搜索结果 - 2
AV-Lip-Sync+: 利用 AV-HuBERT 揭示多模态不一致性的视频深度伪造检测
基于多模态自我监督学习(SSL)特征提取器的多模态视频伪造检测方法,利用音频和视觉模态之间的不一致性来提取视觉和声学特征,并通过多尺度时间卷积神经网络捕捉音频和视觉模态之间的时序相关性,实验结果表明我们的模型在 FakeAVCeleb 和
→
PDF
8 months ago
矩阵故障!基于内容驱动的音视频伪造检测与定位的大规模基准测试
本文提出了一种用于检测 Deepfake 的方法,它通过提出包含多种模式的策略内容驱动音频、视觉和音视频混合进行识别。并通过定量分析证明了 BA-TFD + 算法再 Deepfake 检测方面的优越性。
PDF
a year ago
Prev
Next