Jul, 2023

Polyffusion:一种带有内部和外部控制的多音谱生成扩散模型

TL;DR我们提出了Polyffusion,它是一种扩散模型,通过将音乐视为图像样的钢琴卷轴表示生成重音乐谱。该模型可以通过内部控制和外部控制两种范式对音乐进行可控制生成。实验结果表明,我们的模型明显优于现有的Transformer和基于采样的基线,并使用预训练的解耦表示作为外部条件可以产生更有效的控制。