Nov, 2020

通用 MelGAN: 多领域高保真波形生成的强力神经声码器

TL;DR我们提出了 Universal MelGAN,它是一种合成高保真语音的声码器,可以在多个领域中使用,并通过添加多分辨率频谱图鉴别器来解决大型模型高频带过度平滑的问题,最终生成高度逼真的语音信号。