使用合成数据提高跨视角 2D 人体姿态估计
本研究提出了一种新的数据增强方法,该方法基于分层的人类表示和启发式先验知识,并且可以有效地合成未看见的三维人类骨骼,用于训练二维到三维网络,实验结果表明,我们的方法不仅在最大的公共基准测试中取得了最先进的准确性,而且对未见过的和罕见的姿势的泛化能力也得到了显著提高。
Jun, 2020
我们提出了一个用于多样化合成数据集中人体姿势的框架,该框架利用姿势生成器构造一组新颖的姿势,并使用图像翻译器改变现有合成数据集中的图像以呈现新颖的姿势,同时保持原始风格。通过实验证明,无论合成数据如何被用于训练,以及数据规模如何,利用多样化的合成数据集进行训练都比在少样本情况下使用原始合成数据集对于三个航拍人体检测基准(VisDrone,Okutama-Action 和 ICG)的准确性通常明显更好。
May, 2024
本研究采用系统性研究来分析不同数据集之间多样性和偏差对模型泛化能力的影响,提出了一种同时预测相机视角和人体姿态的模型,取得了显著的跨数据集泛化性能提升。
Apr, 2020
本文提出了一种在 “野外” 环境中进行三维人体姿态估计的解决方案,通过生成大量的具有三维姿势标注的逼真合成图像,并使用这些图像对全身三维姿势进行端对端的卷积神经网络训练,成功地在受控环境(Human3.6M)中优于大多数已发表的作品,并在真实图像(LSP)中展现了有前途的结果。
Feb, 2018
本文提出了使用由 3D 运动捕捉数据生成的合成真实人形图像的大规模数据集 (SURREAL) 来训练卷积神经网络 (CNNs),并且通过该数据集训练的 CNNs 在 RGB 图像中可以准确地进行人物深度估计和人物部分分割。
Jan, 2017
本篇论文提出 SyntheticP3D 数据集和 CC3D 方法,结合这两种方法可以实现在只用 10% 的真实数据的情况下,与当前最先进的模型在物体位姿估计方面取得了可与之媲美结果,在采用 50% 的真实数据时还超越了 SOTA 模型 10.4%。
May, 2023
本研究旨在通过人体姿态空间的采样和真实图像纹理的提取,建立一个全自动,可扩展的方法来合成姿态注释的图像,从而为 3D 姿态估计任务提供合成培训数据,最终证明 CNNs 在合成图像上训练可以在 3D 姿态估计任务上胜过在真实照片上训练。
Apr, 2016
该论文提出了一种采用基于图像合成方法生成真实图片数据集以训练 CNN 模型,用于解决 3D 人体姿态估计缺少真实数据的问题,并通过在受控环境和实境的表现表明其可行性。
Jul, 2016
本文介绍如何使用神经网络模型进行多摄像头人体姿势估计,在考虑多角度遮挡及联合位置不确定性情况下,使用 2D 关键点数据进行训练。相比于经典捆绑调整与弱监督单目 3D 基线方法,我们的模型在 Human3.6M 和 Ski-Pose PTZ 数据集上表现更好。
Aug, 2021