Sep, 2023

扩散条件期望模型用于高效稳健的目标语音提取

TL;DR我们提出了一种名为 Diffusion Conditional Expectation Model(DCEM)的高效生成方法,用于目标语音提取(TSE),它可以处理多个和单个说话者的情况,包括噪声和干净条件,并且我们还引入了 Regenerate-DCEM(R-DCEM),可以根据经过预处理的来自判别模型的语音重建和优化语音质量,我们的方法在入侵和非入侵度量方面优于传统方法,并且在推断效率和对未知任务的鲁棒性方面显示出显著优势。