Codecfake 数据集与深伪造音频的普适检测对策

May, 2024

Codecfake 数据集与深伪造音频的普适检测对策

The Codecfake Dataset and Countermeasures for the Universally Detection of Deepfake Audio

Yuankun Xie, Yi Lu, Ruibo Fu, Zhengqi Wen, Zhiyong Wang...

TL;DR该研究主要关注基于音频语言模型（ALM）的深度伪造音频的检测方法，提出了 CSAM 策略来解决原始 SAM 的领域上升偏差问题，并通过 Codecfake 数据集和 vocoded 数据集的共同训练，在各种测试条件下实现了最低的平均等错误率（EER）为 0.616％。

Abstract

With the proliferation of audio language model (ALM) based deepfake audio, there is an urgent need for effective detection methods. Unlike

audio language model deepfake audio detection methods alm-based audio generation csam strategy

发现论文，激发创造

Codecfake: 用于检测基于 LLM 的深度伪造音频的初始数据集

通过 Codecfake 数据集的实验结果显示，相较于使用 vocoder 的音频深度伪造检测模型，经过编码器训练的模型在 Codecfake 测试集上平均等误差率减少了 41.406%。

Jun, 2024

跨领域音频深度伪造检测：数据集与分析

通过使用五种先进的零样本文本转语音模型生成超过 300 小时的语音数据，构建了一个新的跨领域的 ADD 数据集。通过新颖的攻击增强训练方法，Wav2Vec2-large 模型和 Whisper-medium 模型分别获得了 4.1％和 6.5％的等误差率，展示了出色的少样本 ADD 能力。然而，神经编解码器压缩技术对检测准确性产生重大影响，需要进一步研究。

Apr, 2024

探索绿色 AI 用于音频深度伪造检测

该研究提出了一种新的音频深度伪造检测框架，利用标准 CPU 资源进行无缝训练，并借助自我监督学习模型的嵌入来使用经典机器学习算法，与常用的高碳足迹方法相比，取得了有竞争力的结果。

Mar, 2024

AV-Deepfake1M：大规模基于 LLM 的视听深度伪造数据集

本研究针对高度逼真的深度伪造音视频内容的检测和定位问题提出了 AV-Deepfake1M 数据集，并通过全面的描述和严格的数据质量分析，使用先进的深度伪造检测和定位方法进行了综合基准测试，结果显示与之前数据集相比性能大幅下降。该数据集将在构建下一代深度伪造定位方法中发挥重要作用。

Nov, 2023

对抗式学习的鲁棒音频深度伪造检测（CLAD）

音频深度伪造的广泛应用和威胁需要强大的检测方法。本研究首次全面调查了最常用的音频深伪造检测器对操纵攻击的敏感性，并提出了 CLAD 来改善其鲁棒性。通过对比学习和长度损失等技术，CLAD 显著提高了检测的准确性和鲁棒性。

Apr, 2024

FakeAVCeleb: 一种新的音视频多模态 Deepfake 数据集

针对如今深度学习技术生成的深度伪造技术的滥用所带来的严重安全和隐私问题，本研究提出了 FakeAVCeleb 这一包含视频和相应的合成唇同步伪造音频的新型多模态 Audio-Video Deepfake 数据集，其有助于打破现存音频和视频上的种族偏见，进一步帮助发展多模态深度伪造检测器。

Aug, 2021

通往通讯平台实时深假语音检测系统的发展

本研究旨在评估在实时通信平台上采用静态深假音频检测模型的可行性，研发了可在多平台上运行的可执行软件，并使用 ASVspoof 2019 数据集实现了基于 Resnet 和 LCNN 架构的两个深假音频检测模型，达到了与 ASVspoof 2019 挑战基准的比较性能。该研究提出了增强这些模型的策略和框架，为在通信平台上实现实时深假音频检测铺平了道路，从而推动音频流安全性的进一步发展，并确保在动态实时通信场景下具备强大的检测能力。

Mar, 2024

WaveFake: 一份数据集，用以方便音频 Deepfake 检测

本文介绍了一些用于分析音频信号的常见信号处理技术。我们提供了一个新的数据集，并采用了两个基线模型，以便进一步研究深层次的生成建模在音频信号领域的应用。

Nov, 2021

一种基于多流融合和单类学习的音视频深伪造检测方法

该研究针对深度伪造音视频的检测模型的挑战，提出了一种具有多模态融合和一类学习表示级正则化技术的方法，以解决方法的泛化问题和确保模型的可解释性。实验证明该方法对未见攻击的检测平均改进了 7.31%，同时提供了模型对伪造模态的识别结果。

Jun, 2024

自适应连续学习用于音频深度伪造检测

我们提出了一种持续学习方法，称为 Radian Weight Modification (RWM)，用于音频深度伪造检测，通过引入可训练的梯度修正方向来提高知识获取和减少遗忘，在音频深度伪造检测方面优于其他方法，并显示出在图像识别等不同机器学习领域的潜在重要性。

Dec, 2023