Aug, 2020

一种用于并行语音合成的谱能距离

TL;DR提出了一种基于能量距离的新学习方法,可以训练高度并行的语音模型,并达到隐式生成模型的最新成果,与 GAN-TTS 模型相结合可以提高人类评估者判断的平均意见分数。