关键词cascaded diffusion model
搜索结果 - 2
- ICLR基于级联扩散模型的符号音乐整曲层次生成
本文提出了基于组成层次结构实现完整音乐作品建模的方法,通过定义一种分层语言对流行歌曲的符号化表示进行建模。通过级联扩散模型训练了分层语言模型,实验证明该模型能够生成具有可识别的全局歌词 - 副歌结构和协调音的完整音乐作品,且音乐质量高于基准 - 将度量函数引入扩散模型
我们引入了一种级联扩散模型(Cas-DM),通过在训练中有效地结合额外的度量函数来改进去噪扩散概率模型(DDPM)。实验结果表明,该扩散模型的骨干部分能够有效地利用 LPIPS 损失函数,在各种已建立的基准测试中实现了最先进的图像质量(FI