Nov, 2018

端到端语音识别的循环一致性训练

TL;DR该论文介绍了一种使用未配对数据训练端到端自动语音识别模型的方法,并提出了一种基于语音编码器状态序列而非原始信号的损失来解决在中间文本瓶颈中丢失基本信息的问题,通过对LibriSpeech语料库的实验结果表明,这种循环一致性训练可以将单词错误率从使用100小时配对数据训练的初始模型中减少14.7%,并通过研究仅使用文本数据进行语言建模进一步提高了未配对数据训练的性能。