低秩模型挤压的自适应假音频检测
本文提出了一种完全自动化的端到端虚假音频检测方法,使用了 wav2vec 预训练模型和修改版的 differentiable architecture search 算法(light-DARTS),在 ASVspoof 2019 LA 数据集上取得了 1.08% 的等错误率,性能优于现有的单一系统。
Aug, 2022
研究表明低秩逼近 Fine-Tuning 在捕捉 Fine-Tuning 数据集从初始预训练数据分布中的转变方面具有不足之处,会产生不可忽视的副作用,包括在针对有毒模型和提供公平模型的情景下意外保留不合理的偏差和有毒行为。此外,对于顺序决策任务,需要进行仔细评估以促进负责任的大型语言模型开发。
May, 2024
我们提出了一种持续学习方法,称为 Radian Weight Modification (RWM),用于音频深度伪造检测,通过引入可训练的梯度修正方向来提高知识获取和减少遗忘,在音频深度伪造检测方面优于其他方法,并显示出在图像识别等不同机器学习领域的潜在重要性。
Dec, 2023
我们提出了一种连续学习算法用于检测伪造音频以克服灾难性遗忘,并引入正则化约束来控制特征分布,通过自适应权重修改方向,网络可以在新数据集上有效检测伪造音频,同时保留对旧模型的知识,实现降低灾难性遗忘。我们在多个数据集上评估了我们的方法,并在跨数据集实验中取得了显著的性能改进。
Aug, 2023
利用小波包和短時傅里叶變換等技術,用于波形数据处理,實現了更輕量級的檢測器,用于對抗利用生成式神經網絡制造的合成語音的詐騙行為,對新型 Avocado 和 BigVGAN 網絡的檢測效果更佳。
May, 2023
本研究旨在评估在实时通信平台上采用静态深假音频检测模型的可行性,研发了可在多平台上运行的可执行软件,并使用 ASVspoof 2019 数据集实现了基于 Resnet 和 LCNN 架构的两个深假音频检测模型,达到了与 ASVspoof 2019 挑战基准的比较性能。该研究提出了增强这些模型的策略和框架,为在通信平台上实现实时深假音频检测铺平了道路,从而推动音频流安全性的进一步发展,并确保在动态实时通信场景下具备强大的检测能力。
Mar, 2024
提出了一种名为时序深度伪造定位 (Temporal Deepfake Location,TDL) 的细粒度部分伪造音频检测方法,采用了嵌入相似度模块和时序卷积操作,能够更准确地定位音频的真实性,并在 ASVspoof2019 部分伪造数据集中表现出优异性能。
Sep, 2023