多视角采集无标记 3D 人体姿态注释

CVPRApr, 2017

多视角采集无标记 3D 人体姿态注释

Harvesting Multiple Views for Marker-less 3D Human Pose Annotations

Georgios Pavlakos, Xiaowei Zhou, Konstantinos G. Derpanis, Kostas Daniilidis

TL;DR本文提出了一种基于几何驱动的方法来自动收集人体姿势预测任务的准确的三维人体姿势标注，利用多视角设置、相机设置的 3D 几何和人体身体结构的约束，将每个视图的 2D ConvNet 预测概率组合成全局最优 3D 姿态。

Abstract

Recent advances with convolutional networks (ConvNets) have shifted the bottleneck for many computer vision tasks to annotated data collection. In this paper, we present a geometry-driven approach to automatically collect annotations for →

convolutional networks human pose prediction multi-view setup 3d geometry automatic annotations

发现论文，激发创造

从多视角图像学习单目三维人体姿态估计

本文提出了一种通过多视角的训练，使用一致性约束联合监督损失及惩罚项实现替代大量标注的 3D 人体姿态估计方法，并提出了一种联合估计相机姿态及人体姿态的方法，在 3D 人体姿态估计方面取得了良好的表现。

Mar, 2018

利用显式 2D 特征和中间 3D 表示进行野外人体姿势估计

本文提出了一种基于卷积神经网络的深度学习方法，用于单目 3D 人体姿态估计，具有高精度和更好的野外场景泛化能力，可以联合在具有 3D 标签和仅有 2D 标签的图像数据上进行训练，并在具有挑战性的野外数据上实现了最先进的准确性。

Apr, 2019

三维人体姿态估计几何感知表示的弱监督发现

本研究提出了一种几何感知的人体姿态三维表示方法，通过使用多个视角和简单的自编码器模型以 2D 关键点信息为监督，在训练阶段建立共享的 3D 表示，进而通过骨架编码器 - 解码器机制在潜在空间提取仅与姿态相关的表示。实验结果表明，该方法能够显著提高现有姿态估计方法的性能。

Mar, 2019

合成训练图片以提升人体三维姿势估计

本研究旨在通过人体姿态空间的采样和真实图像纹理的提取，建立一个全自动，可扩展的方法来合成姿态注释的图像，从而为 3D 姿态估计任务提供合成培训数据，最终证明 CNNs 在合成图像上训练可以在 3D 姿态估计任务上胜过在真实照片上训练。

Apr, 2016

无监督几何感知表示用于三维人体姿态估计

本文提出使用多视角图像而无需注释，来学习一个具有几何感知能力的身体表示，通过使用该身体表示，我们的方法在仅使用少量标记数据的情况下，显著优于完全监督的方法，并且在使用仅 1% 标记数据时，也优于其他半监督方法。

Apr, 2018

使用三维卷积神经网络实现时空人体姿态估计

本研究探讨了卷积神经网络在处理单目视觉下 3D 人体姿态感知任务方面的能力，通过将时间维度编码在卷积空间中的第三个维度，直接回归到 3D 坐标空间中的人体关节位置，从而在选定的 Human3.6M 数据集上展示了该网络达到了最先进的性能。

Aug, 2016

基于图像合成的深度 3D 人体姿态估计

本文提出了一种在 “野外” 环境中进行三维人体姿态估计的解决方案，通过生成大量的具有三维姿势标注的逼真合成图像，并使用这些图像对全身三维姿势进行端对端的卷积神经网络训练，成功地在受控环境（Human3.6M）中优于大多数已发表的作品，并在真实图像（LSP）中展现了有前途的结果。

Feb, 2018

MoCap 引导的数据增强在野外三维姿态估计中的应用

该论文提出了一种采用基于图像合成方法生成真实图片数据集以训练 CNN 模型，用于解决 3D 人体姿态估计缺少真实数据的问题，并通过在受控环境和实境的表现表明其可行性。

Jul, 2016

多人无标记数据 3D 姿势估计

本文研究多人姿态估计问题，提出了一种基于多视图系统和深度学习的方法，通过使用图神经网络模型预测场景中不同人之间的视角对应关系，并使用多层感知器模型将 2D 点转换为每个人的 3D 姿态。该模型采用自监督学习方式进行训练，从而避免了对大规模 3D 数据集的依赖。

Dec, 2022

实现视角不变的三维人体姿势估计

提出了一种视角不变的模型，用于从单个深度图像中估计 3D 人体姿态，该模型从一个学习的视角不变特征空间中嵌入局部区域来实现，并采用自下而上的误差反馈机制进行姿态估计，多任务的学习方法可以在噪声和遮挡的情况下选择性地预测局部姿态。通过对一个先前发布的深度数据集和一个包含 10 万个注释深度图像的新收集的人体姿态数据集的评估，实验证明该模型在正面视图上实现了竞争性性能，在替代视角上实现了最先进的性能。

Mar, 2016