具备统计意识的音频-视觉深度伪造检测器
本文研究针对深度伪造技术的威胁,提出了一种在表征层面上辅助音频和视觉融合的多模态深度伪造检测方法,通过使用模态不变和特定的表 征确保保留表示真实或伪造内容的共同模式和每个模态的特定模式,实验证明该方法相比于单模态和多模态音 视频深度伪造检测的最先进方法能够提高17.8%和18.4%的准确性。
Oct, 2023
深度伪造是通过人工智能生成的媒体,其中图像或视频经过数字修改。本研究提出了一种基于音视频的深度伪造检测方法,将细粒度的深度伪造识别与二元分类结合,增强了在域内和跨域测试下的检测能力。
Oct, 2023
本研究针对高度逼真的深度伪造音视频内容的检测和定位问题提出了AV-Deepfake1M数据集,并通过全面的描述和严格的数据质量分析,使用先进的深度伪造检测和定位方法进行了综合基准测试,结果显示与之前数据集相比性能大幅下降。该数据集将在构建下一代深度伪造定位方法中发挥重要作用。
Nov, 2023
通过跨模态学习方法的视听特征融合,我们提出了一种用于改进深假检测的两阶段方法,可以明确地捕捉音频和视觉模态之间的对应关系,并在真实和伪造视频上进行监督学习,取得了98.6%的准确率和99.1%的AUC,相较于当前的音视混合最先进技术,准确率和AUC分别提高了14.9%和9.9%。
Jun, 2024
该研究针对深度伪造音视频的检测模型的挑战,提出了一种具有多模态融合和一类学习表示级正则化技术的方法,以解决方法的泛化问题和确保模型的可解释性。实验证明该方法对未见攻击的检测平均改进了7.31%,同时提供了模型对伪造模态的识别结果。
Jun, 2024
本文提出了基于深度学习的深伪音频检测系统,通过多种变换方法和不同的滤波器转换输入音频为频谱图,并评估了多种深度学习模型在分类任务上的性能,最终融合各种方法实现了在ASVspoofing 2019挑战中竞争力强的伪音频检测。
Jul, 2024
该研究解决了音视频深伪检测中的模态差距问题,提出了一种基于递归神经网络的新的跨模态注意力框架。研究表明,该方法在深伪检测和定位中的准确性和精度分别提高了3.47%和2.05%,显示出显著的性能提升和潜在影响。
Aug, 2024
本研究针对音视频深度伪造检测中的异构数据融合难题,提出了一种基于递归神经网络的多模态注意力框架。该方法利用上下文信息增强音视频数据的特征学习,在深度伪造检测与定位上显示出显著的性能提升,准确率和精确率分别提高了3.47%和2.05%。
Aug, 2024
本研究解决了现有音视深伪造检测方法忽视细微音视伪影的问题,提出了一种新颖的方法来捕捉空间和时间域中的细微伪影。实验结果表明,该方法在DFDC和FakeAVCeleb数据集上相较于当前最先进的技术展示了更好的泛化能力。
Aug, 2024
本研究针对当前音视频深度伪造检测方法忽略细微伪造特征的问题,提出了一种细粒度机制,以捕捉空间和时间领域中的微小伪造痕迹。我们的实验表明,与最先进的方法相比,该方法在数据集内部和跨数据集的泛化能力上具有显著优势。
Aug, 2024