Sep, 2022

基于 ConvNeXt 的音频防欺诈神经网络

TL;DR本文提出了一种基于 ConvNeXt 网络架构的轻量级端到端反欺骗模型,通过加入通道注意力块和使用 focal loss 函数,我们的模型可以专注于最具信息量的语音表示的子带和难以分类的样本,实验表明我们的系统在 ASVSpoof 2019 LA 评估数据集中可以实现 0.64%的等误差率和 0.0187 的 min-tDCF,超过了当前最先进系统。