Sep, 2024

具有场景上下文的多人人体三维运动预测

TL;DR本研究针对长期三维人体运动预测中的挑战,特别是如何从输入序列生成真实的人体运动。提出的场景感知社交变换器模型(SAST)结合了时间卷积编码-解码架构与变换器的瓶颈,有效融合运动和场景信息,实现了对人和物体之间复杂互动的建模。模型在“厨房中的人类”数据集上表现出更高的真实感和多样性,展示了该方法的有效性。