具有场景上下文的多人人体三维运动预测

Sep, 2024

具有场景上下文的多人人体三维运动预测

Massively Multi-Person 3D Human Motion Forecasting with Scene Context

Felix B Mueller, Julian Tanke, Juergen Gall

TL;DR本研究针对长期三维人体运动预测中的挑战，特别是如何从输入序列生成真实的人体运动。提出的场景感知社交变换器模型(SAST)结合了时间卷积编码-解码架构与变换器的瓶颈，有效融合运动和场景信息，实现了对人和物体之间复杂互动的建模。模型在“厨房中的人类”数据集上表现出更高的真实感和多样性，展示了该方法的有效性。

Abstract

Forecasting long-term 3D Human Motion is challenging: the stochasticity of human behavior makes it hard to generate realistic human motion from the input sequence alone. Information on the scene environment and the motion of nearby people can greatly aid the generation process. We prop

发现论文，激发创造

变形金刚网络用于轨迹预测

本文研究了采用Transformer Networks进行轨迹预测，提出了简单模型每个人单独建模的方法，发现使用 Transformers 可以处理现实传感器数据中缺失的观测值，并在轨迹预测基准测试上取得了最好的分数。

Mar, 2020

社交和情境感知的人体运动和姿势预测

本文提出了一种新的框架来处理机器人导航中预测人类动态的问题，该框架将人类运动（或轨迹）和骨骼姿态预测这两个任务统一起来，并考虑到了场景和社交上下文等多种因素，最终在两个社交数据集上表现优异。

Jul, 2020

多范围变压器的多人三维动作预测

我们提出了一种适用于多人3D运动轨迹预测的新型框架，使用包含局部范围编码器和全局范围编码器的Multi-Range Transformers模型，可以实现不同人之间的社交互动，且在长期运动预测方面优于现有方法，甚至可以自动将人分成不同的互动组以预测15人的运动轨迹。

Nov, 2021

PoseGPT：基于量化的三维人体动作生成和预测

提出了一种基于PoseGPT的自回归变换器的方法，该方法可以生成人体运动序列，利用离散的潜在空间使GPT-like模型集中于长程信号预测，获得了在几个数据集上实现最先进的结果。

Oct, 2022

多人姿势预测的轨迹感知身体交互变换器

本文提出了一种称之为TBIFormer的新型多人姿态预测框架，利用社交身体相互作用自我关注机制和轨迹感知相对位置编码来高效地建模身体部位间的交互影响，实验结果表明，在短时和长时预测上，该方法在CMU-Mocap、MuPoTS-3D和合成数据集方面，都显著优于现有的其他方法。

Mar, 2023

随机多人三维运动预测

该论文提出了一种新型的人类运动预测任务，针对多人运动、社交交互和关节运动的复杂性，提出了一种模型框架，通过引入可学习的潜在编码来表示未来动作的意图来实现不同层次的独立个体运动和社交交互建模，在多个数据集上得到了显著的多人预测结果，表现显著优于现有技术水平。

Jun, 2023

TransFusion: 一种实用有效的基于Transformer的扩散模型，用于3D人体动作预测

TransFusion是一种基于扩散的3D人体动作预测模型，它能够生成更有可能发生的样本并保持一定程度的多样性，通过使用Transformer作为骨干，以及在浅层和深层之间使用长跳连接和离散余弦变换来建模运动序列，改善性能，并与使用额外模块的先前基于扩散的模型相比，我们将所有输入（包括条件）都视为令牌，创造出比现有方法更精简的模型。我们对基准数据集进行了广泛的实验研究，以验证我们的人体动作预测模型的有效性。

Jul, 2023

基于场景感知的人体动作预测与互相距离预测

本文介绍了一种关于场景感知的三维人体动作预测的方法，通过建模人与场景之间的相互作用，通过人与场景之间的相互距离来约束人体的局部和全局运动，提出的方法在合成和真实数据集上的表现优于现有方法。

Oct, 2023

Social-MAE：多人动作表示学习的社交遮罩自编码器

为了理解多人场景，我们引入了Social-MAE，一种基于transformer的带掩码自编码器框架，用于多人人体运动数据，并在高级社交任务中达到了最先进的结果。

Apr, 2024

多条件潜在扩散网络用于场景感知神经人体运动预测

通过使用多条件潜在扩散网络，该研究提出了一种重塑人体运动预测任务的方法，该任务基于给定的历史三维身体运动和当前三维场景上下文，以实现人体运动的预测。实验结果表明，该方法在真实和多样化的预测中显著优于现有技术。

May, 2024