Feb, 2024

GLA-Grad:一种 Griffin-Lim 扩展的波形生成扩散模型

TL;DR我们提出了一种称为 GLA-Grad 的新方案,该方案在正常扩散过程的每个步骤中引入了相位恢复算法,以最小化条件错误并提高噪声扩散过程的效率,尤其在为先前未见过的目标演讲者生成语音时,我们的算法优于最先进的扩散模型。