ICMLMay, 2024

基于提示的扩散模型精确音频编辑

TL;DR通过输入的文本提示,我们提出了一种名为 PPAE 的新颖方法,它作为扩散模型的通用模块,实现了精确的音频编辑,通过扩散模型的交叉注意力图来促进准确的局部编辑,并采用分层的局部 - 全局流程确保更流畅的编辑过程,实验证明了我们方法在各种编辑任务中的有效性。