Sep, 2024

基于文本驱动的人类动作生成与运动屏蔽扩散模型

TL;DR该研究解决了现有文本驱动人类动作生成模型在与文本描述相符的高多样性生成能力不足的问题。提出的运动屏蔽扩散模型(MMDM)通过引入特定的运动掩蔽机制,增强了模型在时空语义上下文中学习运动关系的能力。实验证明,该模型在保持运动质量和文本一致性方面表现出色,具有潜在的应用价值。