Oct, 2023

基于能量的语音合成模型

TL;DR这篇论文描述了如何使用基于能量的模型(EBMs)通过噪声对比估计训练,并通过 Langevin Markov Chain Monte-Carlo(MCMC)进行采样,从而扩展了非自回归模型在语音合成中的应用。在 LJSpeech 数据集上的实验证明,该方法在 Tacotron 2 上取得了一定改进。