Nov, 2024

舞蹈融合:用于音频驱动舞蹈动作重建的时空骨架扩散变换器

TL;DR本研究解决了短视频平台(如TikTok)中常见的缺失和噪声骨架数据对于舞蹈动作生成的挑战。提出的DanceFusion框架采用分层Transformer变分自编码器与扩散模型的结合,显著提高了运动的真实感和精确度,展示了在动作生成及与音频同步方面的优越性能,有望推动内容创作、虚拟现实和互动娱乐等领域的发展。