TL;DR该论文提出了一种使用矩阵分解来进行序列 3D 人体姿势估计的深度学习框架,通过对轨迹系数矩阵进行深度回归操作,可以为输入序列中的每个帧输出 3D 姿态估计,取得了多个基准数据集上最先进的表现。
Abstract
Existing deep learning approaches on 3d human pose estimation for videos are
either based on Recurrent or Convolutional Neural Networks (RNNs or CNNs).
However, RNN-based frameworks can only tackle sequences with
本文提出了一种高效利用视频序列中连续帧运动信息来恢复人的三维姿态的方法,并通过回归边界框的时空体到中心帧的 3D 姿势来改进现有方法。同时,为了最大限度地发挥这种方法的潜力,本文阐明必须补偿连续帧中的运动,以使被测量者保持中心,从而能够有效地消除歧义并在 Human3.6m、HumanEva 和 KTH Multiview Football 3D 人体姿态估计基准测试中取得显著改进。