Nov, 2020

非自回归语音合成的分层韵律建模

TL;DR分析了不同韵律建模设置下的非自回归 TTS 模型行为,并提出了一种层次结构,其中基于单词级韵律特征来预测音素级韵律特征的方法,该方法在客观和主观评估中在音频质量和语音韵律自然性方面优于其他竞争对手。