UniPose：单张图片和视频中的统一人体姿态估计

Jan, 2020

UniPose：单张图片和视频中的统一人体姿态估计

UniPose: Unified Human Pose Estimation in Single Images and Videos

Bruno Artacho, Andreas Savakis

TL;DR提出了 UniPose，一种基于瀑布卷积模块的人体姿势估计统一框架，该模块结合了上下文分割和联合定位，实现了单阶段高精度的人体姿态估计，特别是在视频中取得了最先进的结果。

Abstract

We propose UniPose, a unified framework for human pose estimation, based on our "Waterfall" Atrous Spatial Pooling architecture, that achieves state-of-art-results on several pose estimation metrics. Current pose estimation methods utilizing standard →

human pose estimation waterfall module cnn architectures contextual segmentation temporal pose estimation

发现论文，激发创造

视频人体姿势估计的流动卷积神经网络

本文提出了一种基于深度学习和光流的人体姿势估计算法，通过引入时间序列信息和光流辅助，该算法在多个姿态估计数据集上实现了超越当前最先进方法的性能。

Jun, 2015

深度双连续网络用于人体姿态估计

本文提出了一种基于多帧和时序信息的人体姿态估计方法。该方法包含三个模块：姿态时序合成器、姿态残差融合模块和姿态校正网络。在 PoseTrack2017 和 PoseTrack2018 数据集上进行的实验结果表明，该方法取得了最佳效果，并已发布代码以期促进未来的研究。

Mar, 2021

重新思考多级网络用于人体姿态估计

研究单阶段方法与多阶段方法在姿态估计领域的性能表现，提出了单阶段模块设计、跨阶段特征聚合和粗到细的监督等改进建议，所得方法在 MS COCO 和 MPII Human Pose 数据集上都取得了新的最优表现，证明了多阶段架构的有效性。

Jan, 2019

单网络全身姿态估计

本研究提出了一种新的单一神经网络方法，用于 2D 全身姿势估计，并可同时定位身体、面部、手和足关键点。该方法采用一种底部上的公式，使其在图像中的人数不论多少，都能保持恒定的实时性能。神经网络采用多任务学习，经过改进的结构可以处理身体 / 脚和面部 / 手关键点之间的尺度差异。这种方法在速度和全球精度方面都显著优于 OpenPose，并且不像 OpenPose 那样需要为每个手和面候选者运行额外的网络，因此在多人场景中速度更快。本文的研究结果进一步降低了需要 2D 全身信息的应用程序（例如 VR / AR，重新定位）的计算复杂性，而且在面部和手部模糊、低分辨率等情况下，准确率更高。

Sep, 2019

SoloPose: 基于视频数据增强的一次性运动学 3D 人体姿势估计

本文介绍了 SoloPose，一种新颖的一次性、多对多的时空转换模型，用于视频中的运动学 3D 人体姿势估计。SoloPose 进一步加强了 HeatPose，一种基于高斯混合模型分布的 3D 热图，它对目标关键点和动力学相邻关键点进行因素分解。最后，我们通过 3D AugMotion 工具包解决了数据多样性限制问题，该方法通过将四个顶级公共 3D 人体姿势数据集（Humans3.6M、MADS、AIST Dance++、MPI INF 3DHP）投影到一个新的数据集（Humans7.1M）中，使用了一个通用的坐标系统。在 Human3.6M 和增强的 Humans7.1M 数据集上进行了大量实验证明，SoloPose 相对于最先进的方法具有优越的结果。

Dec, 2023

InsPose：面向单阶段多人姿态估计的实例感知网络

使用实例感知动态网络的单阶段范例多人姿态估计方法，相对于两阶段方法在准确性和效率上都有更好的结果。

Jul, 2021

人体姿态估计的级联特征聚合

本文提出了一种基于卷积神经网络的级联特征聚合方法 (Cascade Feature Aggregation, CFA)，该方法可以有效地提高人体姿态估计的精度，并且在 MPII 数据集和 LIP 数据集上实现了最佳成绩。

Feb, 2019

UPose3D：带有跨视角和时间线索的不确定性感知 3D 人体姿态估计

UPose3D 是一种新颖的多视图 3D 人体姿势估计方法，通过改进鲁棒性和可扩展性来解决准确性的挑战，同时不需要直接的 3D 注释。

Apr, 2024

带有空间上下文信息的人体姿态估计

本文探讨了空间背景信息在人体姿态估计中的重要性，提出了利用上下文信息的 Cascade Prediction Fusion 和 Pose Graph Neural Network 两个模块。在 MPII 和 LSP 基准测试中，实验结果表明我们的方法始终优于以前的方法。

Jan, 2019

DirectPose：直接端到端的多人姿势估计

提出了第一个直接的端到端多人姿态估计框架，称为 DirectPose，使用新的关键点对齐机制 (KPAlign)，该机制提高了准确性，并消除了需在底部向上方法中处理的启发式分组或在自顶向下方法中进行边界框检测和 RoI 操作。实验证明，这一端到端模式在人体姿态估计任务中可以达到与之前强大基线相媲美或更好的表现。

Nov, 2019