Jun, 2022

NU-Wave 2: 一个通用的神经音频上采样模型,适用于各种采样率

TL;DRNU-Wave 2 模型是一种扩散模型,可以从不同采样率的输入产生 48KHz 音频信号,这个模型使用了短时傅里叶卷积和带宽谱特征变换方式来生成谐波,可以在不需要为每一对采样率都进行训练的情况下,生成高分辨率音频信号。