基于 ConvNeXt 的音频防欺诈神经网络

Sep, 2022

基于 ConvNeXt 的音频防欺诈神经网络

ConvNeXt Based Neural Network for Audio Anti-Spoofing

Qiaowei Ma, Jinghui Zhong, Yitao Yang, Weiheng Liu, Ying Gao...

TL;DR本文提出了一种基于 ConvNeXt 网络架构的轻量级端到端反欺骗模型，通过加入通道注意力块和使用 focal loss 函数，我们的模型可以专注于最具信息量的语音表示的子带和难以分类的样本，实验表明我们的系统在 ASVSpoof 2019 LA 评估数据集中可以实现 0.64％的等误差率和 0.0187 的 min-tDCF，超过了当前最先进系统。

Abstract

With the rapid development of speech conversion and speech synthesis algorithms, automatic speaker verification (ASV) systems are vulnerable to spoofing attacks. In recent years, researchers had proposed a number

automatic speaker verification spoofing attacks convnext network architecture anti-spoofing focal loss function

发现论文，激发创造

嵌入空间中语音验证泛化及欺骗感知

通过在嵌入空间中利用有限的训练数据来增强简单的后端分类器，我们提出了通用的独立式自动说话人验证（G-SASV）系统，以对抗欺骗攻击，同时避免在测试（认证）阶段单独使用 CM 模块，在 ASVspoof 2019 逻辑访问数据集中，我们相对统计 ASV 后端在合并（真实和欺骗）和欺骗条件下的性能分别最大提高了 36.2％和 49.8％，以等错误率为指标。

Jan, 2024

基于原始波形 CLDNN 的端到端欺诈检测

本文介绍了一种基于原始波形的深度模型进行欺骗检测的方法，该模型同时作为特征提取器和分类器，消除了数据的任何预处理和后处理，通过使用卷积长短时神经网络（CLDNN），使得在 BTAS2016 数据集上系统性能从最佳 1.26％半总误差率（HTER）显著提高到现在的 0.82％HTER，并表现出在未知条件下也能很好地进行欺骗检测。

Jul, 2020

自动说话人验证系统的反欺诈方法

本研究旨在通过分析不同的声学特征空间和分类器，确定可靠和强大的对抗欺骗攻击的措施。实验结果表明，基于深度神经网络（DNN）的方法在欺骗检测任务中获得了相当低的等错误率 (EER)

May, 2017

ASVspoof 2015 挑战中的 STC 防欺骗系统

本文提出了基于不同声学特征空间的对抗攻击反欺诈技术，并比较了线性和非线性分类器的效果。实验表明，相位相关和小波基础特征对系统效率的提高有重要作用。

Jul, 2015

ASVspoof 2019：欺诈和假音频检测的未来展望

ASVspoof 2019 是社区带领的挑战活动之一，主要关注自动说话人验证（ASV）系统面对欺骗的反制措施，其中考虑了逻辑和物理接入情况，三种欺骗攻击方式，使用神经声学和波形模型生成欺骗攻击，采用双重检测费用函数（t-DCF）对 ASV 系统可靠性进行评估，并囊括了对伪造音频侦测的关注。共有 63 个研究团队参与了此次活动，半数以上的团队报告的系统性能优于两个基线欺骗反制措施。 - 摘自 ASVspoof 2019 的数据库、协议和挑战结果。该工作展示了在反制欺骗和伪造音频方面的实际进展。

Apr, 2019

无监督域自适应的防欺骗说话人验证

研究如何提高自动说话人验证系统的欺骗稳健性，主要从基于概率线性判别分析的后端分类器入手，并运用三种无监督领域适应技术来优化它。旨在提高系统在逻辑和物理接近情境下的表现，对于后者，尤其是在被重放音频攻击时，针对真实的和伪造的情况，相对改进率分别达到 36.1% 和 5.3% 接近最高点。除此之外，还进行了一些额外的研究，如攻击分析、数据构成和与高斯后端的分数级别的对策系统的集成分析。

Mar, 2022

复数值神经网络用于语音反欺骗

本文介绍了一种新的方法，通过使用复数值神经网络处理输入音频的 CQT 频域表示，结合了幅度谱图和原始音频处理方法的优点，既保留了相位信息又可使用可解释人工智能方法，结果表明该方法在 “野外” 反欺诈数据集上优于先前的方法，并通过可解释人工智能解释结果，剔除研究证明该模型已学会使用相位信息来检测声音伪造。

Aug, 2023

利用 SE-Res2Net-Conformer 结构进行合成语音检测和音频剪辑检测

本文提出了一种使用 Res2Net 和 Conformer block 相结合的架构来改进声纹鉴定的欺骗对策，同时也提出了一种新的音频拼接检测问题的深度学习方法，该方法可以检测拼接边界而不是完整的拼接片段。

Oct, 2022

全自动端到端假音频检测

本文提出了一种完全自动化的端到端虚假音频检测方法，使用了 wav2vec 预训练模型和修改版的 differentiable architecture search 算法（light-DARTS），在 ASVspoof 2019 LA 数据集上取得了 1.08% 的等错误率，性能优于现有的单一系统。

Aug, 2022

近期神经欺骗对抗合成语音检测方法比较研究

本研究通过对后端神经网络与训练标准的比较，评估 ASVspoof 2019 逻辑访问任务的对策模型，发现随机初始种子会对模型性能造成显著影响，但平均池化和新的无超参数损失函数是比较优秀的技术。

Mar, 2021