Jun, 2024

Thunder: 一种使用布朗桥进行单向反演步骤的统一回归扩散语音增强方法

TL;DR通过使用基于扩散的语音增强方法,初始化扩散过程以改进音频,并使用回归模型可以减少计算步骤,提出了一种名为 Thunder 的统一回归 - 扩散模型,该模型利用布朗桥过程可在两种模式下运行,通过将扩散时间步骤设置为接近 1 可访问回归模式,但是标准得分扩散建模在此设置中性能不佳,为了缓解这个问题,我们修改了扩散模型以预测干净的语音而不是得分函数,从而以更紧凑的模型大小和更少的反向步骤实现了具有竞争力的性能。