Sep, 2019

端到端语音识别的自训练

TL;DR本文探讨了自我训练在端到端语音识别中的应用,并展示给出了使用伪标签训练深度学习模型的方法,经过实验证明了该方法可以大幅提高基准模型的准确率,通过使用语音和语言模型生成伪标签和一些序列到序列模型的过滤机制,并采用新颖的集成方法提高伪标签的多样性,实验结果表明,在噪声语音环境下,使用自我训练的集成模型可以相对于只使用100小时标记数据的基准模型,使字错率(WER)提高了33.9%;在清晰语音环境下,自我训练可以弥补基准模型和理想模型之间相对提高了至少93.8%的差距。