MoCap 引导的数据增强在野外三维姿态估计中的应用

NIPSJul, 2016

MoCap 引导的数据增强在野外三维姿态估计中的应用

MoCap-guided Data Augmentation for 3D Pose Estimation in the Wild

Grégory Rogez, Cordelia Schmid

TL;DR该论文提出了一种采用基于图像合成方法生成真实图片数据集以训练 CNN 模型，用于解决 3D 人体姿态估计缺少真实数据的问题，并通过在受控环境和实境的表现表明其可行性。

Abstract

This paper addresses the problem of 3d human pose estimation in the wild. A significant challenge is the lack of training data, i.e., 2D images of humans annotated with 3D poses. Such data is necessary to train state-of-the-art CNN architectures. Here, we propose a solution to generate

3d human pose estimation cnn architectures image-based synthesis engine synthetic images 3d motion capture

发现论文，激发创造

基于图像合成的深度 3D 人体姿态估计

本文提出了一种在 “野外” 环境中进行三维人体姿态估计的解决方案，通过生成大量的具有三维姿势标注的逼真合成图像，并使用这些图像对全身三维姿势进行端对端的卷积神经网络训练，成功地在受控环境（Human3.6M）中优于大多数已发表的作品，并在真实图像（LSP）中展现了有前途的结果。

Feb, 2018

野外单目 3D 人体姿势估计基于优化 CNN 监督

提出了一种基于 CNN 的方法，利用现有的 3D 姿势数据和 2D 姿势数据进行迁移学习，在真实场景中实现了最先进的性能，同时引入了一个人类身体姿势估计的新训练集，并提出了一个覆盖室内和室外场景的新基准。

Nov, 2016

利用显式 2D 特征和中间 3D 表示进行野外人体姿势估计

本文提出了一种基于卷积神经网络的深度学习方法，用于单目 3D 人体姿态估计，具有高精度和更好的野外场景泛化能力，可以联合在具有 3D 标签和仅有 2D 标签的图像数据上进行训练，并在具有挑战性的野外数据上实现了最先进的准确性。

Apr, 2019

合成训练图片以提升人体三维姿势估计

本研究旨在通过人体姿态空间的采样和真实图像纹理的提取，建立一个全自动，可扩展的方法来合成姿态注释的图像，从而为 3D 姿态估计任务提供合成培训数据，最终证明 CNNs 在合成图像上训练可以在 3D 姿态估计任务上胜过在真实照片上训练。

Apr, 2016

野外单目三维人体姿态估计的普适性推广

研究人员提出了一种基于立体视觉启发的神经网络技术和几何搜索方案来生成高质量的 3D 姿势地面真实数据，使不需要专业训练模式和辅助损失函数的神经网络模型在野外图像数据中实现良好的 3D 姿态估计结果。

Apr, 2019

深度级联单眼三维人体姿态估计与演化训练数据

本研究提出了一种新的数据增强方法，该方法基于分层的人类表示和启发式先验知识，并且可以有效地合成未看见的三维人类骨骼，用于训练二维到三维网络，实验结果表明，我们的方法不仅在最大的公共基准测试中取得了最先进的准确性，而且对未见过的和罕见的姿势的泛化能力也得到了显著提高。

Jun, 2020

野外无监督单目 3D 人体姿态估计 CanonPose

本文提出了一种自我监督的方法，利用未标注的多视角数据学习单图像三维姿态估计器，通过多视角一致性约束将观察到的二维姿态分离成基础的三维姿态和相机旋转，并且提出了新的、无偏的重建目标函数，跨视角和训练样本混合信息。该方法在两个基准数据集（Human3.6M 和 MPII-INF-3DHP）和野外 SkiPose 数据集上进行了评估。

Nov, 2020

走向野外三维人体姿态估计：一种弱监督方法

本文提出了一种混合 2D 和 3D 标签的深度神经网络，通过弱监督迁移学习的方法，将控制实验室环境下的 3D 姿态标签转移到野外图像，使用共享表示直接训练完成增强的 2D 姿态估计子网络和 3D 深度回归子网络，并引入 3D 几何约束来规范 3D 姿态预测，以在无底深度标签的情况下提高准确度。该方法在 2D 和 3D 基准测试中均取得了优异的结果。

Apr, 2017

单图像三维人体姿态估计的双源方法

本研究提出一种利用双重数据源，结合深度神经网络和运动捕捉数据，实现从单张图片中估计三维人体姿态的方法，并对该方法进行了全面评估。

May, 2017

MetaPose: 无需 3D 监督，快速从多视图中获得 3D 姿态

本文介绍如何使用神经网络模型进行多摄像头人体姿势估计，在考虑多角度遮挡及联合位置不确定性情况下，使用 2D 关键点数据进行训练。相比于经典捆绑调整与弱监督单目 3D 基线方法，我们的模型在 Human3.6M 和 Ski-Pose PTZ 数据集上表现更好。

Aug, 2021