CVPRMar, 2024

自然移动,灵活互动:利用场景可控生成语言引导的人体动作

TL;DR在 3D 环境中,尽管在文本到运动合成方面取得了重大进展,但仍存在许多挑战,我们通过引入一种新的两阶段框架,使用场景赋能作为中间表示,有效地链接 3D 场景定位和条件运动生成,克服了生成多模态条件信号下的人类运动困难,特别是在缺乏广泛的语言 - 场景 - 运动数据对的有限数据训练时,验证了模型的出色泛化能力。