Jun, 2021

WaveGrad 2: 文本到语音合成的迭代改进

TL;DR本论文介绍了 WaveGrad 2,这是一种非自回归的生成模型,用于语音合成。通过迭代细化过程,模型使用梯度估计语音波形的对数条件密度,从而生成音频波形。实验证明,该模型可以生成高保真音频。