通过预测相机视角提高 3D 人体姿态估计的跨数据集泛化能力
通过使用多视角数据对单目人体姿态估计模型进行微调,引入新的一致性损失函数,提升性能,从而实现对特定应用定制模型的实用和经济有效解决方案。
Nov, 2023
研究人员提出了一种基于立体视觉启发的神经网络技术和几何搜索方案来生成高质量的 3D 姿势地面真实数据,使不需要专业训练模式和辅助损失函数的神经网络模型在野外图像数据中实现良好的 3D 姿态估计结果。
Apr, 2019
本文提出了一种通过多视角的训练,使用一致性约束联合监督损失及惩罚项实现替代大量标注的 3D 人体姿态估计方法,并提出了一种联合估计相机姿态及人体姿态的方法,在 3D 人体姿态估计方面取得了良好的表现。
Mar, 2018
提出两种新技术解决单目深度预测模型因训练数据相机位置偏差带来的泛化性能下降问题,一种基于数据增强的方法,一种基于条件模型的方法,实验证明两种方法能够显著提高模型在拍摄位置不同的图像中的预测效果和泛化性能。
Jul, 2020
提出了一种视角不变的模型,用于从单个深度图像中估计 3D 人体姿态,该模型从一个学习的视角不变特征空间中嵌入局部区域来实现,并采用自下而上的误差反馈机制进行姿态估计,多任务的学习方法可以在噪声和遮挡的情况下选择性地预测局部姿态。通过对一个先前发布的深度数据集和一个包含 10 万个注释深度图像的新收集的人体姿态数据集的评估,实验证明该模型在正面视图上实现了竞争性性能,在替代视角上实现了最先进的性能。
Mar, 2016
提出使用多视角和单视角数据训练的两阶段方法来检测和估计 3D 人体姿势,通过将数据进行正确的分类来构建准确的模型,避免了数据采集难题。该方法在 Human3.6M 数据集上获得了竞争性的结果,并在 MV 临床数据集上显著提高了结果。
Apr, 2018
该论文提出了一种名为 AdaptPose 的端到端框架,通过生成合成的 3D 人体动作数据,并在新数据集上通过微调来提高 3D 姿态估计模型的泛化能力,该方法成功地比之前的交叉数据集评估方法和使用部分 3D 注释的半监督学习方法改进了 14% 和 16%。
Dec, 2021
提出了一种基于自监督学习的预训练方法,使用仅图像的人类中心数据对模型进行训练,通过学习关于 3D 和人体运动的先验知识,在一系列人体相关任务中优于现有的自监督预训练方法,并在模型基于和不基于模型的人体网格重建的精调任务上达到了最先进的性能。
Nov, 2023
本论文提出了一种基于多个校准相机视角的、面向实时应用的多人三维姿态估计解决方案,利用视频中的时间一致性直接在三维空间中匹配二维输入与三维姿态,通过跨视图多人跟踪迭代地更新姿态,从而提高了准确性和效率,并介绍了新的大规模多人数据集。
Mar, 2020
提出了一种名为 RePoGen 的人体姿势综合控制方法,它可以生成具有极端视角和姿势的图像,我们使用这种方法来增强 COCO 数据集,实验证明,添加 RePoGen 数据后,可以超过以前的顶视姿态估计算法,同时显著提高底视点数据集的性能。
Jul, 2023