Jun, 2021

Fre-GAN: 对抗训练的频率一致音频合成

TL;DR本文提出了一种名为 “Fre-GAN” 的神经音源模型,通过分辨率连接生成器和分辨率智能的鉴别器,在多个频带中学习各种尺度的频谱分布,有效地实现高保真频率一致性音频合成,并在质量和 MOS 上优于标准模型。