MMAug, 2020

LSTM 语音模型通过字形对齐和发音学习

TL;DR本文介绍了一种基于图音分离的语音识别训练方法,并将其应用于四种印度语言的研究中。实验表明,使用该训练方法训练的模型在大型数据集上具有与基于音素模型相媲美的声学建模效果,并且产生的音频到图音对齐性能优秀,非常适合于实际应用。