BiHRNet：用于人体姿势估计的二进制高分辨率网络

Nov, 2023

BiHRNet：用于人体姿势估计的二进制高分辨率网络

BiHRNet: A Binary high-resolution network for Human Pose Estimation

Zhicheng Zhang, Xueyao Sun, Yonghao Dang, Jianqin Yin

TL;DR在本研究中，提出了一种名为 BiHRNet（Binary HRNet）的二值人体姿势估计器，该估计器在适应二值神经网络（BNN）的同时保留了 HRNet 的关键点提取能力，通过提出二值网络训练过程的优化方法以及设计更适合二值化的结构，实现了更少的计算资源开销和精度下降，并在实验中取得了较好的性能。

Abstract

human pose estimation (HPE) plays a crucial role in computer vision applications. However, it is difficult to deploy state-of-the-art models on resouce-limited devices due to the high computational costs of the networks. In this work, a binary human pose estimator named BiHRNet(

human pose estimation binary hrnet binarization information reconstruction bottleneck multi-scale basic block

发现论文，激发创造

多阶段 HRNet: 用于人体姿态估计的多阶段高分辨率网络

本文介绍了一种名为 Multi-Stage HRNet 的人体姿势估计模型，并采用多阶段网络和交叉阶段特征聚合等技术优化了关键点位置，从而在 COCO 数据集上取得了 77.1 AP 得分。

Oct, 2019

用于人体姿态估计和图像识别的二进制网络的改进训练

本篇论文提出一系列工程技术来改善二值化神经网络的准确性，包括更合适的激活函数、反向初始化、渐进式量化、网络叠加等，并在人体姿态估计和 ImageNet 大规模图像识别任务中验证了其优越性。此外，还首次探讨了二值化神经网络和知识蒸馏相结合的效果。

Apr, 2019

HigherHRNet：基于比例感知的自下而上人体姿势估计表示学习

这篇论文提出了 HigherHRNet，一种新的从下往上的人体姿态估计方法，使用高分辨率特征金字塔学习尺度感知表示，具有多分辨率监督训练和多分辨率聚合推理的能力，能够解决下向多人姿势估计中的尺度变化挑战，从而更精确地定位关键点，尤其适用于小尺寸人体，实现了比以前最好的下向方法在 COCO test-dev 中中等人体上 2.5% AP 的提高。在 CrowdPose test 上，HigherHRNet 甚至超过了所有自上而下的方法，表明其在拥挤场景中具有鲁棒性。

Aug, 2019

高效 HRNet: 轻量级高分辨率多人姿态估计的高效缩放

本研究提出了 EfficientHRNet，这是一系列轻量级多人姿势估计器，能够在资源受限设备上实时执行姿势估计操作。通过将模型缩放的最新进展与高分辨率特征表示的统一，EfficientHRNet 在降低计算量的同时创建高度准确的模型，最大的模型能够在 1/3 的计算量和 1/3 的功率的情况下，实现与现有最先进水平相近的精度。

Jul, 2020

Dite-HRNet：用于人体姿态估计的动态轻量级高分辨率网络

通过在高分辨率网络中引入动态轻量化、多尺度上下文信息提取、长距离空间依赖建模的方法，本文提出了一种动态轻量化高分辨率网络模型（Dite-HRNet），该模型在 COCO 和 MPII 人体姿态估计数据集上取得了优异的表现，超越了现有的轻量化网络模型。

Apr, 2022

Lite-HRNet：轻量级高分辨率网络

本论文提出了高效高分辨率网络 Lite-HRNet，通过条件通道加权替代 shuffle blocks 中的昂贵的逐点（1x1）卷积来提高轻量级网络，对人体姿势估计和语义分割任务都能提供卓越的结果。

Apr, 2021

二值化三维全身人体网格恢复

通过使用 Binarized Dual Residual Network (BiDRN) 量化方法，本文在资源有限的边缘设备上以 22.1% 的参数和 14.8% 的运算量实现了与全精度方法 Hand4Whole 相当的性能，且在 3D 全身人体网格恢复任务中显著提高了与最先进的二值化算法相比的效果。

Nov, 2023

多实例姿态网络：重新思考自上而下的姿态估计

提出了一种名为 Multi-Instance Pose Network (MIPNet) 的人体姿势估计模型，能够在给定边框范围内预测多个 2D 姿态实例，并引入了一种称为多实例调制块（Multi-Instance Modulation Block，MIMB）的方法来适应性地调制每个实例的通道特征响应，与以往方法相比，在复杂场景中取得了显著的性能提升。

Jan, 2021

利用有限资源的分层二元卷积神经网络进行关键点定位

本文提出了一种具有轻量、紧凑和适用于适用于计算资源有限应用的体系结构，并在人体姿势估计和面部对齐等定位任务上，详细研究了神经网络二值化的效果，提出了多种正交方法来提高性能，在此基础上，提出了一种新的分层、并行和多尺度残差架构，同时具有与标准瓶颈块相同数量的参数，从而填补了原始网络与其二值化对应物之间的差距，大幅提高了性能，并在人体姿势估计和面部对齐等最具挑战性的数据集上获得了最前沿的表现，同时探究了其性质与性能，并支持关于面部部分分割的其他结果。

Aug, 2018

HEViTPose：高效视觉变压器用于人体姿态估计

这篇研究论文提出了一种高效率视觉变压器（HEViTPose）用于人体姿势估计，通过特征分组、空间降级机制及多维度注意力头保持特征多样性。通过优化模型的 Patch Embedded Overlap Width，实现了性能、参数和 GFLOPs 的改进，与最先进模型相当，但更轻量化。

Nov, 2023