Jun, 2024

用于反欺骗检测的预训练语音模型中隐藏嵌入的关注性合并

TL;DR本文研究了 WavLM 模型在反欺诈任务中的多层行为,并提出了一种注意力融合方法来利用分层隐藏嵌入,结果表明微调 WavLM 能够在 ASVspoof 2019LA、2021LA 和 2021DF 的评估集上分别达到 0.65%、3.50% 和 3.19% 的最佳等错误率,值得注意的是,我们发现 WavLM 大模型的早期隐藏 Transformer 层对反欺诈任务有显著贡献,并通过使用部分预训练模型实现了计算效率。