Jun, 2024

利用大规模 ASR 模型,在自监督学习中追求说话者验证的有监督性能

TL;DR自我监督学习在发音验证中表现出与有监督系统相近的性能,本研究通过对预训练的 WavLM 进行自我监督有监督微调并使用伪标签,实现了语音表示学习中的有监督性能,取得了 0.99%的 EER,接近有监督基线 0.94%的 EER。