Apr, 2024

MIDGET: 基于音乐条件的 3D 舞蹈生成

TL;DR介绍了一种名为 MIDGET 的音乐条件化 3D 舞蹈生成模型,基于舞蹈动作向量量化变分自编码器(VQ-VAE)模型和动作生成预训练(GPT)模型,以生成与音乐节奏相匹配的充满活力且高质量的舞蹈。通过引入三个新组件:1)基于 Motion VQ-VAE 模型的预训练记忆代码本,用于存储不同的人体姿势代码,2)利用 Motion GPT 模型通过音乐和动作编码器生成姿势代码,3)一个用于音乐特征提取的简单框架。通过与现有最先进模型进行比较,并在 AIST++(最大的公开音乐舞蹈数据集)上进行消融实验,实验证明我们提出的框架在运动质量和与音乐的协调性方面实现了最先进的性能。