May, 2023

通过扩散模型了解基于文本驱动的关键帧协作运动合成

TL;DR本文提出了一种基于文本的运动合成技术,使用 DiffKFC 建立了一个条件扩散模型,该模型结合了关键帧来协作控制运动,通过 Dilated Mask Attention 模块来实现对身体姿势的微观描述,以实现高效、协同、粗细粒度的生成运动的目的。实验表明,本模型在人机交互 3D 和 KIT 等文本到运动数据集上表现出了最先进的性能。