May, 2020

无需更多数据:通过文本到语音数据增强来提高端到端语音识别

TL;DR采用数据增强和 TTS 技术,对 ASR 的训练数据进行扩充,并通过集成语言模型,在 LibriSpeech 数据上建立 end-to-end 模型,相对于半监督技术的效果更好。