Sep, 2024

基于潜在扩散的多源音乐生成

TL;DR本研究解决了现有音乐生成模型无法生成丰富旋律的问题,并提出采用变分自编码器的多源潜在扩散模型(MSLDM)。该方法通过对每个乐器源进行独立编码,显著提高了音乐生成的质量和效率,实验结果表明,MSLDM优于现有的多源扩散模型(MSDM)。