多阶段 HRNet: 用于人体姿态估计的多阶段高分辨率网络
研究单阶段方法与多阶段方法在姿态估计领域的性能表现,提出了单阶段模块设计、跨阶段特征聚合和粗到细的监督等改进建议,所得方法在 MS COCO 和 MPII Human Pose 数据集上都取得了新的最优表现,证明了多阶段架构的有效性。
Jan, 2019
这篇论文提出了 HigherHRNet,一种新的从下往上的人体姿态估计方法,使用高分辨率特征金字塔学习尺度感知表示,具有多分辨率监督训练和多分辨率聚合推理的能力,能够解决下向多人姿势估计中的尺度变化挑战,从而更精确地定位关键点,尤其适用于小尺寸人体,实现了比以前最好的下向方法在 COCO test-dev 中中等人体上 2.5% AP 的提高。在 CrowdPose test 上,HigherHRNet 甚至超过了所有自上而下的方法,表明其在拥挤场景中具有鲁棒性。
Aug, 2019
本研究提出了 EfficientHRNet,这是一系列轻量级多人姿势估计器,能够在资源受限设备上实时执行姿势估计操作。通过将模型缩放的最新进展与高分辨率特征表示的统一,EfficientHRNet 在降低计算量的同时创建高度准确的模型,最大的模型能够在 1/3 的计算量和 1/3 的功率的情况下,实现与现有最先进水平相近的精度。
Jul, 2020
在本研究中,提出了一种名为 BiHRNet(Binary HRNet)的二值人体姿势估计器,该估计器在适应二值神经网络(BNN)的同时保留了 HRNet 的关键点提取能力,通过提出二值网络训练过程的优化方法以及设计更适合二值化的结构,实现了更少的计算资源开销和精度下降,并在实验中取得了较好的性能。
Nov, 2023
本论文利用 pytorch 实现了一种深度高分辨率表示学习方法用于人体姿态估计,通过建立多分辨率子网并在并行连接中进行信息融合,最终得到更精准、更高精度的关键点热图,实验证明该方法在 COCO 关键点检测数据集和 MPII 人体姿态数据集上具有显著优势。
Feb, 2019
通过在高分辨率网络中引入动态轻量化、多尺度上下文信息提取、长距离空间依赖建模的方法,本文提出了一种动态轻量化高分辨率网络模型(Dite-HRNet),该模型在 COCO 和 MPII 人体姿态估计数据集上取得了优异的表现,超越了现有的轻量化网络模型。
Apr, 2022
本文提出了一种多尺度结构感知神经网络,通过多尺度监督、多尺度回归网络、中间监督和结构感知损失以及关键点掩蔽训练方案等四个方面对深度卷积 - 反卷积沙漏模型进行改进,以有效地提高人体姿势估计的性能。该网络不仅可以解决尺度差异、遮挡和复杂多人场景等问题,而且可以全局优化多尺度特征的结构匹配,并在 MPII 挑战排行榜上取得了领先地位。
Mar, 2018
通过提出的 HG-RCNN 网络,借助 Mask-RCNN 和 Hourglass 结构进行多人 3D 人体姿态估计,实现对每个感兴趣区域(RoI)中 2D 关键点的先预测后提升,最终采用弱透视投影模型和焦距和根偏移的联合优化将估计的 3D 姿态置于相机坐标系下,该网络简单模块化且无需多人 3D 姿态数据集,取得了 MuPoTS-3D 数据集的最优性能,并能近似在相机坐标系下估计 3D 姿态。
Sep, 2019
该研究提出了基于深度卷积去卷积模型的鲁棒人体姿态估计方法,通过多尺度的上下文监督和全局回归的方式增强模型的姿态鲁棒性,并在 MPII 和 FLIC 数据集上展示了具有竞争力的性能。
Aug, 2018
本文针对使用 Mask RCNN 进行人体姿态估计时存在的性能问题及效率问题,提出了一种基于改进后的全局上下文模块和 ResNet-50 骨架的人体姿态估计方法,取得了较好的姿态估计效果和运行效率。
Jan, 2023