Jun, 2023

Vocos:面向高质量音频合成的时域和傅里叶神经声码器之间的差距的缩小

TL;DR本研究提出了 Vocos 模型,该模型利用基于傅里叶变换的时频表示解决了复杂值谱图的直接重建问题,并显著提高了计算效率,具有与时域神经编码方法相媲美的音频质量和具有频率感知能力的生成器。