Mar, 2024

通过语言引导的姿态代码编辑实现可控动作生成

TL;DRCoMo 是一种可控运动生成模型,通过利用大型语言模型的先验知识,在准确生成和编辑动作方面表现出色。它将动作分解为离散且语义上有意义的姿势代码,每个代码都包含身体部位的语义信息,如 “左膝稍微弯曲”。通过调整姿势代码,CoMo 可以实现直接干预动作编辑。实验证明,与最先进的模型相比,CoMo 在运动生成方面具有竞争力,在人体研究中,CoMo 在动作编辑能力方面远远超过以前的工作。