Jun, 2024
利用大规模 ASR 模型,在自监督学习中追求说话者验证的有监督性能
Towards Supervised Performance on Speaker Verification with
Self-Supervised Learning by Leveraging Large-Scale ASR Models
TL;DR自我监督学习在发音验证中表现出与有监督系统相近的性能,本研究通过对预训练的WavLM进行自我监督有监督微调并使用伪标签,实现了语音表示学习中的有监督性能,取得了0.99%的EER,接近有监督基线0.94%的EER。