ICLRJun, 2020

FastSpeech 2: 快速高質量的端到端文本轉語音

TL;DR提出了 FastSpeech 2,直接使用语音波形从文本中生成语音,并且通过使用更多的变化信息作为条件输入,解决了非自回归文本到语音模型中的一对多映射问题,从而实现更高的语音质量。