Oct, 2023
关于合成训练数据中音素持续时间变异性对自动语音识别的相关性
On the Relevance of Phoneme Duration Variability of Synthesized Training Data for Automatic Speech Recognition
Nick Rossenbach, Benedikt Hilmes, Ralf Schlüter
TL;DR通过生成的合成数据以及时长建模来改进低资源环境或领域不匹配任务中的自动语音识别系统,并使用半监督方法在改进中合成数据的语音识别系统中取得了改进。