May, 2019

FastSpeech: 快速、健壮、可控的文本到语音

TL;DR本研究提出了一种基于 Transformer 模型、并行生成梅尔频谱的快速语音合成模型 FastSpeech,它在语音质量、稳定性、可控性和速度方面均具备相应优点。