BriefGPT.xyz
Ask
alpha
关键词
audio super-resolution
搜索结果 - 4
Gull:一种生成式多功能音频编解码器
通过引入 Gull,我们介绍了一种生成式多功能音频编解码器。Gull 是一种通用的神经音频压缩和解压模型,可应用于广泛的任务和应用,如实时通信、音频超分辨率和编解码器语言模型。我们比较了 Gull 与现有的传统音频编解码器和神经音频编解码器
→
PDF
3 months ago
AudioSR:大规模多功能音频超分辨率
通过使用扩散基于生成模型的 AudioSR,我们能够对多种音频类型进行稳健的音频超分辨率处理,包括音效、音乐和语音,并在 2kHz 到 16kHz 的带宽范围内将输入音频信号上采样到 24kHz 带宽的高分辨率音频信号,从而大大提高音频生成
→
PDF
10 months ago
NU-Wave 2: 一个通用的神经音频上采样模型,适用于各种采样率
NU-Wave 2 模型是一种扩散模型,可以从不同采样率的输入产生 48KHz 音频信号,这个模型使用了短时傅里叶卷积和带宽谱特征变换方式来生成谐波,可以在不需要为每一对采样率都进行训练的情况下,生成高分辨率音频信号。
PDF
2 years ago
NU-Wave: 一种用于神经音频升采样的扩散概率模型
NU-Wave 是第一个基于神经声码器设计的扩散概率模型进行音频超分辨率处理,可以将粗糙的 16kHz 或 24kHz 的采样率升高到 48kHz。NU-Wave 在各项性能测试中表现优异,且仅需要 3.0M 的参数,比基线模型小很多。
PDF
3 years ago
Prev
Next