Mar, 2024
文本条件下音乐扩散模型的广义多源推理
Generalized Multi-Source Inference for Text Conditioned Music Diffusion Models
Emilian Postolache, Giorgio Mariani, Luca Cosmo, Emmanouil Benetos, Emanuele Rodolà
TL;DR该论文将多源扩散模型推广到任意时域扩散模型,基于文本嵌入来训练这些模型,实现了有机的音乐生成和声音分离,且在松散数据设置下展示出竞争力的生成和分离结果。