关键词human-scene interactions
搜索结果 - 3
- 从文本描述中生成三维场景的人类动作
通过将任务分解为两个可管理的子问题:目标对象的语言准确性和以目标对象为中心的运动生成,本文提出了一种新的方法来生成给定人 - 场景交互文本描述的 3D 室内场景中的人体动作,实验表明我们的方法在运动质量方面优于基线并验证了我们的设计选择。
- GenZI: 零 Shot 3D 人物场景交互生成
可以不借助任何 3D 人 - 场景交互数据合成 3D 人与场景交互吗?我们提出了 GenZI,这是第一个零样本方法,用于生成 3D 人与场景的交互。GenZI 的关键在于从大型视觉 - 语言模型 (VLMs) 中提取交互先验知识,这些先验知 - 基于场景感知的人体动作预测与互相距离预测
本文介绍了一种关于场景感知的三维人体动作预测的方法,通过建模人与场景之间的相互作用,通过人与场景之间的相互距离来约束人体的局部和全局运动,提出的方法在合成和真实数据集上的表现优于现有方法。