Apr, 2019

使用非成对语音和文本的半监督序列到序列自动语音识别

TL;DR本文提出了一种新的半监督训练方法,该方法结合了端到端的不可区分的ASR->TTS损失和TTS->ASR损失,利用未配对的语音和文本数据,相较于其他相关技术在WSJ和Librispeech语料库上的WER性能更好。