Sep, 2023

AudioSR:大规模多功能音频超分辨率

TL;DR通过使用扩散基于生成模型的 AudioSR,我们能够对多种音频类型进行稳健的音频超分辨率处理,包括音效、音乐和语音,并在 2kHz 到 16kHz 的带宽范围内将输入音频信号上采样到 24kHz 带宽的高分辨率音频信号,从而大大提高音频生成模型的生成质量。