Oct, 2022

滤波和进化:半监督自动语音识别的渐进式伪标签精炼

TL;DR本文研究使用伪标签微调自监督预训练模型的方法,提出通过平均概率分数过滤低质量的伪标签,挑选高可信性训练数据,迭代更新模型纠正不可靠的伪标签并去除噪声标签的策略,以提高语音识别性能。实验结果表明,该方法在 LibriSpeech 上具有良好表现。