Oct, 2024

基于扩散的自回归运动模型DART:实时文本驱动的运动控制

TL;DR本研究解决了文本驱动的人类运动生成面临的挑战,特别是如何创建连续且复杂的动作,以响应长期文本描述。提出的DART模型通过结合运动历史和文本输入,使用潜在扩散模型学习紧凑的运动原语空间,实现了实时的动作生成,并在运动现实性、效率和可控性方面超越了现有基线。