使用合成数据提高跨视角 2D 人体姿态估计

Jul, 2023

使用合成数据提高跨视角 2D 人体姿态估计

Improving 2D Human Pose Estimation across Unseen Camera Views with Synthetic Data

Miroslav Purkrábek, Jiří Matas

TL;DR提出了一种名为 RePoGen 的人体姿势综合控制方法，它可以生成具有极端视角和姿势的图像，我们使用这种方法来增强 COCO 数据集，实验证明，添加 RePoGen 数据后，可以超过以前的顶视姿态估计算法，同时显著提高底视点数据集的性能。

Abstract

human pose estimation is a thoroughly researched problem; however, most datasets focus on the side and front-view scenarios. We address the limitation by proposing a novel approach that tackles the challenges posed by extreme viewpoints and poses. We introduce a new method for

human pose estimation extreme viewpoints repogen synthetic data generation coco dataset

发现论文，激发创造

深度级联单眼三维人体姿态估计与演化训练数据

本研究提出了一种新的数据增强方法，该方法基于分层的人类表示和启发式先验知识，并且可以有效地合成未看见的三维人类骨骼，用于训练二维到三维网络，实验结果表明，我们的方法不仅在最大的公共基准测试中取得了最先进的准确性，而且对未见过的和罕见的姿势的泛化能力也得到了显著提高。

Jun, 2020

多样化的合成数据中的人体姿态对于航空视角人体检测的作用

我们提出了一个用于多样化合成数据集中人体姿势的框架，该框架利用姿势生成器构造一组新颖的姿势，并使用图像翻译器改变现有合成数据集中的图像以呈现新颖的姿势，同时保持原始风格。通过实验证明，无论合成数据如何被用于训练，以及数据规模如何，利用多样化的合成数据集进行训练都比在少样本情况下使用原始合成数据集对于三个航拍人体检测基准（VisDrone，Okutama-Action 和 ICG）的准确性通常明显更好。

May, 2024

从未见过的视角识别动作的人造人类

本研究旨在探讨合成人类能否提高人类动作识别的性能，特别关注对不寻常拍摄视角的泛化能力，研究发现数据的合成和扩充可以带来性能的提升。

Dec, 2019

通过预测相机视角提高 3D 人体姿态估计的跨数据集泛化能力

本研究采用系统性研究来分析不同数据集之间多样性和偏差对模型泛化能力的影响，提出了一种同时预测相机视角和人体姿态的模型，取得了显著的跨数据集泛化性能提升。

Apr, 2020

基于图像合成的深度 3D 人体姿态估计

本文提出了一种在 “野外” 环境中进行三维人体姿态估计的解决方案，通过生成大量的具有三维姿势标注的逼真合成图像，并使用这些图像对全身三维姿势进行端对端的卷积神经网络训练，成功地在受控环境（Human3.6M）中优于大多数已发表的作品，并在真实图像（LSP）中展现了有前途的结果。

Feb, 2018

从合成人中学习

本文提出了使用由 3D 运动捕捉数据生成的合成真实人形图像的大规模数据集 (SURREAL) 来训练卷积神经网络 (CNNs)，并且通过该数据集训练的 CNNs 在 RGB 图像中可以准确地进行人物深度估计和人物部分分割。

Jan, 2017

基于合成数据的鲁棒性类别层次 3D 姿态估计

本篇论文提出 SyntheticP3D 数据集和 CC3D 方法，结合这两种方法可以实现在只用 10% 的真实数据的情况下，与当前最先进的模型在物体位姿估计方面取得了可与之媲美结果，在采用 50% 的真实数据时还超越了 SOTA 模型 10.4%。

May, 2023

合成训练图片以提升人体三维姿势估计

本研究旨在通过人体姿态空间的采样和真实图像纹理的提取，建立一个全自动，可扩展的方法来合成姿态注释的图像，从而为 3D 姿态估计任务提供合成培训数据，最终证明 CNNs 在合成图像上训练可以在 3D 姿态估计任务上胜过在真实照片上训练。

Apr, 2016

MoCap 引导的数据增强在野外三维姿态估计中的应用

该论文提出了一种采用基于图像合成方法生成真实图片数据集以训练 CNN 模型，用于解决 3D 人体姿态估计缺少真实数据的问题，并通过在受控环境和实境的表现表明其可行性。

Jul, 2016

MetaPose: 无需 3D 监督，快速从多视图中获得 3D 姿态

本文介绍如何使用神经网络模型进行多摄像头人体姿势估计，在考虑多角度遮挡及联合位置不确定性情况下，使用 2D 关键点数据进行训练。相比于经典捆绑调整与弱监督单目 3D 基线方法，我们的模型在 Human3.6M 和 Ski-Pose PTZ 数据集上表现更好。

Aug, 2021