Mar, 2024

WHAC: 世界凝视的人类与摄像机

TL;DR利用摄像头视频准确地估计人体和摄像头在世界坐标系中的轨迹是一个既希望实现又具有挑战性和没有确切解的问题。该研究旨在通过充分利用世界、人体和摄像头之间的协同作用,共同恢复富有表现力的参数化人体模型(即 SMPL-X)和相应的摄像头姿势,基于两个关键观察结果,即相机框架的 SMPL-X 估计方法可以方便地恢复人体的绝对深度,以及人体动作本质上提供绝对空间线索。通过整合这些洞察,我们引入了一种新的框架,称为 WHAC,以促进基于世界的富有表现力的人体姿势和形状估计,并且无需依赖传统的优化技术进行相机姿势估计。此外,我们还提供了一个新的合成数据集,WHAC-A-Mole,其中包括准确标注的人体和摄像头,并具有多样化的人体交互动作和逼真的摄像头轨迹。对标准和新建立的基准的广泛实验证明了我们框架的优越性和效果。我们将公开提供代码和数据集。