WaveFake: 一份数据集，用以方便音频 Deepfake 检测

Nov, 2021

WaveFake: 一份数据集，用以方便音频 Deepfake 检测

WaveFake: A Data Set to Facilitate Audio Deepfake Detection

Joel Frank, Lea Schönherr

TL;DR本文介绍了一些用于分析音频信号的常见信号处理技术。我们提供了一个新的数据集，并采用了两个基线模型，以便进一步研究深层次的生成建模在音频信号领域的应用。

Abstract

deep generative modeling has the potential to cause significant harm to society. Recognizing this threat, a magnitude of research into detecting so-called "deepfakes" has emerged. This research most often focuses

deep generative modeling deepfakes audio signals data set baseline models

发现论文，激发创造

基于深度学习的音频伪造检测网络的泛化

利用小波包和短時傅里叶變換等技術，用于波形数据处理，實現了更輕量級的檢測器，用于對抗利用生成式神經網絡制造的合成語音的詐騙行為，對新型 Avocado 和 BigVGAN 網絡的檢測效果更佳。

May, 2023

深度伪造音频的系统指纹识别：一份初始数据集和调查

本论文提出了一个用于系统指纹识别的 deepfake 音频数据集，并进行了初步调查，数据集由五个语音合成系统使用最先进的深度学习技术收集而成，为系统指纹识别方法的开发提供了一些基准和研究发现。

Aug, 2022

FakeAVCeleb: 一种新的音视频多模态 Deepfake 数据集

针对如今深度学习技术生成的深度伪造技术的滥用所带来的严重安全和隐私问题，本研究提出了 FakeAVCeleb 这一包含视频和相应的合成唇同步伪造音频的新型多模态 Audio-Video Deepfake 数据集，其有助于打破现存音频和视频上的种族偏见，进一步帮助发展多模态深度伪造检测器。

Aug, 2021

SceneFake: 场景虚假音频检测的初始数据集和基准

本研究旨在设计用于检测伪造声音的数据集 SceneFake，其中出现的操纵声音仅涉及使用语音增强技术将发音的声学场景篡改。该数据集不仅可以在已知操纵的测试集上检测假话，还可评估假检测模型对未知操纵攻击的泛化能力，并对使用不同语音增强技术和信噪比实施的伪造攻击进行了分析。结果表明，ASVspoof 2019 的现有基线模型无法可靠地检测到场景被篡改的语音，并且检测未知场景操纵声音仍然具有挑战性。

Nov, 2022

检测音乐深度伪造容易但实际上很困难

这篇论文展示了对真实音频数据集和假重建数据集进行分类器训练的可能性与出乎意料的容易程度，达到了 99.8% 的令人信服的准确率，标志着音乐深度伪造检测器的首次发表。然而，通过对其他领域伪造检测的几十年文献的了解，我们强调一个好的测试得分并不是故事的结束，而且指出部署的检测器可能存在的问题与未来研究方向。

May, 2024

Deepfakes 生成和检测：现状、挑战、对策和发展方向

本文综述了现有工具和基于机器学习的方法，用于深度伪造（Deepfake）的生成和检测，并讨论了目前的公共数据集和对技术进行性能评估的关键标准，强调了未来研究的方向。

Feb, 2021

自动身份识别对音频视觉深度伪造的漏洞

该研究论文介绍了首个真实的音频 - 视觉深度伪造数据库 SWAN-DF，其中嘴唇和语音同步，并具有高质量的视觉和音频。研究表明，通过调整现有的预训练深度伪造模型来适应特定身份，可以在超过 90% 的时间内成功欺骗人脸和说话人识别系统，并获得非常逼真的伪造视频。

Nov, 2023

即时深度伪造威胁讨论文件

本文讨论了生成式深度学习模型所造成的威胁，特别是其用于混淆、欺诈和社会工程攻击等方面的弊端，并且提出了加强社会防御的建议。

Jun, 2023

SingFake: 唱歌声深度伪造检测

提出了歌声深度伪造检测任务，创建了第一个真实数据集 SingFake，包含 40 位歌手 5 种语言的 28.93 小时真实歌曲和 29.40 小时深度伪造歌曲片段，评估了四个最先进的口语对抗系统，发现在 SingFake 上训练相对于在口语测试数据上训练有显著改进，但也提出了未知歌手、通信编解码器、语言和音乐背景等挑战。

Sep, 2023

以深假音频作为训练自动语音转文字模型的数据增强技术

使用深度伪造音频的数据增广技术，通过在各种情景下训练语音转文字模型，验证了提出的框架。

Sep, 2023