Feb, 2020

本地先验匹配的半监督语音识别

TL;DR该论文提出了局部先验匹配(LPM)作为一种半监督学习目标,通过从强先验(例如语言模型)中提取知识为无标签语音的判别模型提供学习信号来训练语音识别模型,在可比较的实验设置下,证明了LPM在理论上的合理性,实现的简单性以及优于现有知识蒸馏技术。使用LPM方法,相对于在相同数据集上完全有监督模型,通过将100小时已标注语音与额外的360小时未标注数据训练,能够使干净和嘈杂的测试集上的词错误率分别回复到54%和73%。