Apr, 2024

TAAT:从任意文本思考和行动的Text2Motion

TL;DRText2Motion旨在从文本中生成人体动作。本文重新定义了此问题,以更现实的假设为基础,即文本可以是任意的。通过在HumanML3D数据集上扩展动作文本以涵盖更多场景文本,创建了HumanML3D++数据集。在这个挑战性的数据集中,我们提出了一个新颖的两阶段框架来从任意文本中提取动作标签并生成动作。通过不同的应用场景进行广泛实验证明了该方法在现有和提出的数据集上的有效性。结果表明,在这个现实的设置中,Text2Motion是非常具有挑战性的,为这个实际方向的新研究提供了动力。我们将发布数据集和代码。