WaveFake: 一份数据集,用以方便音频 Deepfake 检测
利用小波包和短時傅里叶變換等技術,用于波形数据处理,實現了更輕量級的檢測器,用于對抗利用生成式神經網絡制造的合成語音的詐騙行為,對新型 Avocado 和 BigVGAN 網絡的檢測效果更佳。
May, 2023
本论文提出了一个用于系统指纹识别的 deepfake 音频数据集,并进行了初步调查,数据集由五个语音合成系统使用最先进的深度学习技术收集而成,为系统指纹识别方法的开发提供了一些基准和研究发现。
Aug, 2022
针对如今深度学习技术生成的深度伪造技术的滥用所带来的严重安全和隐私问题,本研究提出了 FakeAVCeleb 这一包含视频和相应的合成唇同步伪造音频的新型多模态 Audio-Video Deepfake 数据集,其有助于打破现存音频和视频上的种族偏见,进一步帮助发展多模态深度伪造检测器。
Aug, 2021
本研究旨在设计用于检测伪造声音的数据集 SceneFake,其中出现的操纵声音仅涉及使用语音增强技术将发音的声学场景篡改。该数据集不仅可以在已知操纵的测试集上检测假话,还可评估假检测模型对未知操纵攻击的泛化能力,并对使用不同语音增强技术和信噪比实施的伪造攻击进行了分析。结果表明,ASVspoof 2019 的现有基线模型无法可靠地检测到场景被篡改的语音,并且检测未知场景操纵声音仍然具有挑战性。
Nov, 2022
这篇论文展示了对真实音频数据集和假重建数据集进行分类器训练的可能性与出乎意料的容易程度,达到了 99.8% 的令人信服的准确率,标志着音乐深度伪造检测器的首次发表。然而,通过对其他领域伪造检测的几十年文献的了解,我们强调一个好的测试得分并不是故事的结束,而且指出部署的检测器可能存在的问题与未来研究方向。
May, 2024
本文综述了现有工具和基于机器学习的方法,用于深度伪造(Deepfake)的生成和检测,并讨论了目前的公共数据集和对技术进行性能评估的关键标准,强调了未来研究的方向。
Feb, 2021
该研究论文介绍了首个真实的音频 - 视觉深度伪造数据库 SWAN-DF,其中嘴唇和语音同步,并具有高质量的视觉和音频。研究表明,通过调整现有的预训练深度伪造模型来适应特定身份,可以在超过 90% 的时间内成功欺骗人脸和说话人识别系统,并获得非常逼真的伪造视频。
Nov, 2023
提出了歌声深度伪造检测任务,创建了第一个真实数据集 SingFake,包含 40 位歌手 5 种语言的 28.93 小时真实歌曲和 29.40 小时深度伪造歌曲片段,评估了四个最先进的口语对抗系统,发现在 SingFake 上训练相对于在口语测试数据上训练有显著改进,但也提出了未知歌手、通信编解码器、语言和音乐背景等挑战。
Sep, 2023