Nov, 2020

端到端混合语音识别的数据增强

TL;DR本文提出了三种针对语种转换数据的增强方法,即音频接合、TTS 和单词转换或插入生成语料,并展示了这些方法对基于端到端自动语音识别系统(ASR)的语种转换系统的性能提升,这些方法可结合近期热门技术 SpecAugment 使用,相对于没有数据增强的系统,WER 显著降低了 24.0%,相对于只有 SpecAugment 的系统还有 13.0%的收益。