DiffDance: 舞蹈生成的级联人体运动扩散模型

MMAug, 2023

DiffDance: 舞蹈生成的级联人体运动扩散模型

DiffDance: Cascaded Human Motion Diffusion Model for Dance Generation

Qiaosong Qi, Le Zhuo, Aixi Zhang, Yue Liao, Fei Fang...

TL;DR将音乐与运动结合的 DiffDance 模型能够生成与输入音乐有效对齐的逼真舞蹈序列，结果与最先进的自回归方法相媲美。

Abstract

When hearing music, it is natural for people to dance to its rhythm. Automatic dance generation, however, is a challenging task due to the physical constraints of human motion and rhythmic alignment with target music. Conventional autoregressive methods introduce compounding errors dur

dance generation motion diffusion model music embeddings geometric losses realistic dance sequences

发现论文，激发创造

LongDanceDiff：基于条件扩散模型的长期舞蹈生成

通过设计了一种长期舞蹈生成模型，LongDanceDiff，基于条件扩散模型，在解决时间一致性和空间约束方面具有挑战性，以提高生成舞蹈动作的多样性和质量。

Aug, 2023

双向自回归扩散模型的舞蹈生成

使用双向自回归扩散模型 (BADM) 生成与音乐相协调的舞蹈动作，通过在前后方向均保持协调一致的双向编码器和局部信息解码器，实现了生成新动作、平滑运动、提高舞蹈与节拍的同步性等功能。实验结果表明，该模型在音乐到舞蹈生成的重要基准上达到了最先进的性能。

Feb, 2024

Music2Dance：音乐驱动的舞蹈生成 DanceNet

该论文提出了一种基于自回归生成模型的新方法 DanceNet，以音乐的风格、节奏和旋律为控制信号生成具有高度真实感和多样性的 3D 舞蹈动作，并通过专业舞者捕捉了多组同步的音乐舞蹈配对数据集以提高模型性能，实验结果表明所提出的方法达到了最先进的效果。

Feb, 2020

使用自回归扩散模型的可控运动合成和重建

该研究介绍了 MoDiff，它是一个基于自回归概率扩散模型的运动序列生成模型，其结合了跨模式 Transformer 编码器和基于 Transformer 的解码器，以生成控制时序依赖性的动作。该模型在运动合成方面表现优异，并通过数据丢弃方法来提高数据表示和运动合成的鲁棒性。

Apr, 2023

舞动的阿凡达：基于姿势和文本引导的人体动作视频合成与图像扩散模型

提出了一种名为 “Dancing Avatar” 的方法，通过文本和姿势驱动，利用训练良好的 T2I 扩散模型生成逐帧人体运动视频，同时保持上下文相关性、人物外观一致性和背景连续性，实现生成具有出色质量的人类视频。

Aug, 2023

舞蹈视频生成中的节拍与视觉融合

通过音乐作为条件输入，直接从静态图像中生成舞蹈视频的 Dance Any Beat Diffusion 模型引入了图像到视频生成原则，采用了音乐作为图像到视频生成的条件因素。

May, 2024

音乐指挥运动生成中的扩散模型驯服

该论文提出了 Diffusion-Conductor，它是一种基于 DDIM 的新方法，用于从给定的交响乐中生成乐队指挥的运动，并使用几种新的测量标准进行评估。

Jun, 2023

通过课程学习生成长期跟音乐舞蹈的 Dance Revolution

本文提出了一种基于序列到序列学习的音乐条件舞蹈生成方法，通过设计一种课程学习策略，使其在长时间序列生成过程中减轻自回归模型中的误差积累，从而有效地捕捉音乐和舞蹈之间的微观对应关系，实验结果表明，该方法在自动度量和人类评估等方面明显优于现有技术水平。

Jun, 2020

DreaMoving: 基于扩散模型的人类舞蹈视频生成框架

提出 DreaMoving，一种基于扩散的可控制视频生成框架，用于生成高质量的个性化人类舞蹈视频。

Dec, 2023

Transflower：多模态注意力下的概率自回归舞蹈生成

本研究提出了一种基于 Transformer 模型，结合之前姿势以及音乐情境来建模未来舞蹈动作分布的概率自回归模型，同时使用了包括专业舞者和业余舞者的当前最大的 3D 舞蹈动作数据集，通过物体评价和用户调查对比了两个基准模型，并表明要生成与音乐相匹配的有趣，多样和逼真的舞蹈，既需要模型具备建模概率分布的能力，又需要能够关注大范围的运动和音乐情境。

Jun, 2021