May, 2024

BUDDy: 单通道盲无监督除混响实现弥散模型

TL;DR该论文提出了一种基于扩散模型的无监督单声道方法,用于联合盲去混响和房间脉冲响应估计。在各个频率子带上使用带指数衰减的滤波器对混响运算符进行参数化,并沿反向扩散轨迹迭代估计相应的参数。通过测量一致性准则强化生成语音与混响测量的真实性,同时无条件的扩散模型实现了对清晰语音生成的强先验。在没有任何关于房间脉冲响应或混响 - 无混响耦合数据的信息下,我们能够在各种声学场景中成功地进行去混响。我们的方法明显优于先前的盲无监督基准线,并且我们展示了相对于盲监督方法对未见声学条件更具鲁棒性。在线上可获取音频样本和代码。