Mar, 2024

LM2D: 歌词与音乐驱动的舞蹈合成

TL;DR通过将音乐和歌词作为条件,在一次扩散生成步骤中创建与歌词和音乐相匹配的逼真且多样化的舞蹈,通过使用多模态扩散模型和一致性蒸馏构建了新颖的概率架构 LM2D,并引入涵盖音乐和歌词的第一个 3D 舞蹈动作数据集,该模型的结果经过客观度量和人类评估表明,能够产生与歌词和音乐匹配的逼真且多样化的舞蹈。