舞蹈视频生成中的节拍与视觉融合

May, 2024

舞蹈视频生成中的节拍与视觉融合

Dance Any Beat: Blending Beats with Visuals in Dance Video Generation

Xuanchen Wang, Heng Wang, Dongnan Liu, Weidong Cai

TL;DR通过音乐作为条件输入，直接从静态图像中生成舞蹈视频的 Dance Any Beat Diffusion 模型引入了图像到视频生成原则，采用了音乐作为图像到视频生成的条件因素。

Abstract

The task of generating dance from music is crucial, yet current methods, which mainly produce joint sequences, lead to outputs that lack intuitiveness and complicate data collection due to the necessity for precise joint annotations. We introduce a Dance Any Beat Diffusion model, namely DabFusion, that employs music as a conditional input to directly create

dance generation image-to-video synthesis conditional image-to-video generation music as a conditioning factor motion-music alignment score

发现论文，激发创造

DiffDance: 舞蹈生成的级联人体运动扩散模型

将音乐与运动结合的 DiffDance 模型能够生成与输入音乐有效对齐的逼真舞蹈序列，结果与最先进的自回归方法相媲美。

Aug, 2023

Music2Dance：音乐驱动的舞蹈生成 DanceNet

该论文提出了一种基于自回归生成模型的新方法 DanceNet，以音乐的风格、节奏和旋律为控制信号生成具有高度真实感和多样性的 3D 舞蹈动作，并通过专业舞者捕捉了多组同步的音乐舞蹈配对数据集以提高模型性能，实验结果表明所提出的方法达到了最先进的效果。

Feb, 2020

音乐驱动的编舞生成：使用自回归编码器 - 解码器网络

通过使用自回归编码解码网络设计了一种音乐驱动舞蹈编排生成系统，该网络利用音乐和对应的舞蹈运动，运用多媒体片段进行训练，能够在只有音乐输入的情况下生成新的舞蹈运动。经过用户研究，结果表明该方法可以生成富有音乐感和自然的新舞蹈动作。

Nov, 2018

Dance2Music: 自动舞蹈驱动音乐生成

本研究探索了实现在给定舞蹈的情况下生成音乐的可能性，并基于搜索算法和深度神经网络开发了两种不同的方法，并通过与强启发法基准模型的比较，证明了这些方法的有效性。

Jul, 2021

基础舞步生成的弱监督深度递归神经网络

本研究提出了一种基于弱监督深度循环方法的，使用音频功率谱作为输入的基础舞蹈生成模型，采用卷积层和多层 LSTM 处理音频输入，并利用对比代价函数调节音乐和舞蹈节拍之间的映射，同时从舞蹈节拍生成弱标签进行模型训练，实验结果表明，该模型可以在小数据集上生成基础舞蹈步伐，并且保持与基准舞者类似的 F - 分数。

Jul, 2018

从舞蹈视频生成复杂音乐的量化生成对抗网络

D2M-GAN 是一个基于多模态对抗网络的音乐生成框架，能够根据舞蹈视频生成对应的流行音乐等复杂风格，使用向量量化的音频表示，通过对多个数据集的评估，证明了此方法的有效性，并提供了一个使用 TikTok 视频的数据集用于未来相关研究的起点。

Apr, 2022

MusicLDM: 使用节奏同步混合策略增强文本生成音乐中的新颖性

通过构建一种文本到音乐模型，并利用分布式扩散模型和音频广义线性模型来进行训练以生成新音乐，解决了音乐生成过程中的数据不足、版权和抄袭等问题。同时通过节拍跟踪和两种不同的数据增强策略，即拍子同步音频混合和拍子同步潜在混合，实现对训练数据的重组，从而生成多样化且保持风格一致的音乐。最终，通过基于对比语音 - 音频预训练模型的评估指标，进一步证明了所提出的音乐生成模型和拍子同步混合策略能够提高生成音乐的质量、创新性和与输入文本的对应关系。

Aug, 2023

双向自回归扩散模型的舞蹈生成

使用双向自回归扩散模型 (BADM) 生成与音乐相协调的舞蹈动作，通过在前后方向均保持协调一致的双向编码器和局部信息解码器，实现了生成新动作、平滑运动、提高舞蹈与节拍的同步性等功能。实验结果表明，该模型在音乐到舞蹈生成的重要基准上达到了最先进的性能。

Feb, 2024

通过课程学习生成长期跟音乐舞蹈的 Dance Revolution

本文提出了一种基于序列到序列学习的音乐条件舞蹈生成方法，通过设计一种课程学习策略，使其在长时间序列生成过程中减轻自回归模型中的误差积累，从而有效地捕捉音乐和舞蹈之间的微观对应关系，实验结果表明，该方法在自动度量和人类评估等方面明显优于现有技术水平。

Jun, 2020

愿舞者与你同在：非人形舞蹈生成框架

我们提出了一个框架，使非人形代理能够从人类视频中学习跳舞，通过训练一个奖励模型，该模型可以感知光流（视觉节奏）和音乐之间的关系，并通过生成与音乐匹配的视觉节奏的动作来学习跳舞。

May, 2024