Jan, 2023

使用预训练的Diffusion模型改善源分离

TL;DR本文研究了语音分离问题,通过将分离模型和扩散模型的输出线性相结合,并利用学习到的权重来实现在多说话人的同时达到前所未有的语音分离效果,从而推翻了先前成立的基于人类语音确定性模型的上界限制。