Dec, 2018

Skeleton Transformer Networks:从单张 RGB 图像提取 3D 人体姿态和皮肤网格

TL;DR该研究提出了一种名为 Skeleton Transformer Networks 的网络框架,可以通过单张彩色图像预测出人体骨架的 3D 关节点位置和 3D 角度姿态,并从而生成蒙皮网格动画。该框架采用两步回归方法进行骨骼旋转预测,其中第一步通过考虑骨架结构回归骨骼旋转以获得初始解,第二步则基于被称为交叉热图的三维姿态表示采用热图回归器进行精细化调整。实验表明,使用该框架训练的 3D 人体姿势数据集可以在野外环境下通过单张图像准确预测出人体的 3D 姿态。