UniPose:单张图片和视频中的统一人体姿态估计
本文提出了一种基于多帧和时序信息的人体姿态估计方法。该方法包含三个模块:姿态时序合成器、姿态残差融合模块和姿态校正网络。在 PoseTrack2017 和 PoseTrack2018 数据集上进行的实验结果表明,该方法取得了最佳效果,并已发布代码以期促进未来的研究。
Mar, 2021
研究单阶段方法与多阶段方法在姿态估计领域的性能表现,提出了单阶段模块设计、跨阶段特征聚合和粗到细的监督等改进建议,所得方法在 MS COCO 和 MPII Human Pose 数据集上都取得了新的最优表现,证明了多阶段架构的有效性。
Jan, 2019
本研究提出了一种新的单一神经网络方法,用于 2D 全身姿势估计,并可同时定位身体、面部、手和足关键点。该方法采用一种底部上的公式,使其在图像中的人数不论多少,都能保持恒定的实时性能。神经网络采用多任务学习,经过改进的结构可以处理身体 / 脚和面部 / 手关键点之间的尺度差异。这种方法在速度和全球精度方面都显著优于 OpenPose,并且不像 OpenPose 那样需要为每个手和面候选者运行额外的网络,因此在多人场景中速度更快。本文的研究结果进一步降低了需要 2D 全身信息的应用程序(例如 VR / AR,重新定位)的计算复杂性,而且在面部和手部模糊、低分辨率等情况下,准确率更高。
Sep, 2019
本文介绍了 SoloPose,一种新颖的一次性、多对多的时空转换模型,用于视频中的运动学 3D 人体姿势估计。SoloPose 进一步加强了 HeatPose,一种基于高斯混合模型分布的 3D 热图,它对目标关键点和动力学相邻关键点进行因素分解。最后,我们通过 3D AugMotion 工具包解决了数据多样性限制问题,该方法通过将四个顶级公共 3D 人体姿势数据集(Humans3.6M、MADS、AIST Dance++、MPI INF 3DHP)投影到一个新的数据集(Humans7.1M)中,使用了一个通用的坐标系统。在 Human3.6M 和增强的 Humans7.1M 数据集上进行了大量实验证明,SoloPose 相对于最先进的方法具有优越的结果。
Dec, 2023
本文提出了一种基于卷积神经网络的级联特征聚合方法 (Cascade Feature Aggregation, CFA),该方法可以有效地提高人体姿态估计的精度,并且在 MPII 数据集和 LIP 数据集上实现了最佳成绩。
Feb, 2019
UPose3D 是一种新颖的多视图 3D 人体姿势估计方法,通过改进鲁棒性和可扩展性来解决准确性的挑战,同时不需要直接的 3D 注释。
Apr, 2024
本文探讨了空间背景信息在人体姿态估计中的重要性,提出了利用上下文信息的 Cascade Prediction Fusion 和 Pose Graph Neural Network 两个模块。在 MPII 和 LSP 基准测试中,实验结果表明我们的方法始终优于以前的方法。
Jan, 2019
提出了第一个直接的端到端多人姿态估计框架,称为 DirectPose,使用新的关键点对齐机制 (KPAlign),该机制提高了准确性,并消除了需在底部向上方法中处理的启发式分组或在自顶向下方法中进行边界框检测和 RoI 操作。实验证明,这一端到端模式在人体姿态估计任务中可以达到与之前强大基线相媲美或更好的表现。
Nov, 2019