Jun, 2023

UnDiff: 无监督语音恢复与无条件扩散模型

TL;DR本文介绍了 UnDiff,一种扩散概率模型,能够解决各种语音反问题,并可以应用于条件不同的任务,如降级反演、神经声波编解码和语音来源分离等。首先,我们比较了不同的神经架构和预处理方法来解决无条件波形生成的难题,并通过最新的扩散模型后处理技术演示了如何将无条件扩散模型应用于语音处理中的不同任务。最终,在带宽扩展、去剪辑、声学编解码和语音来源分离等任务上展示了所提出的技术的性能,并与基线进行比较。