BiHRNet:用于人体姿势估计的二进制高分辨率网络
本文介绍了一种名为 Multi-Stage HRNet 的人体姿势估计模型,并采用多阶段网络和交叉阶段特征聚合等技术优化了关键点位置,从而在 COCO 数据集上取得了 77.1 AP 得分。
Oct, 2019
本篇论文提出一系列工程技术来改善二值化神经网络的准确性,包括更合适的激活函数、反向初始化、渐进式量化、网络叠加等,并在人体姿态估计和 ImageNet 大规模图像识别任务中验证了其优越性。此外,还首次探讨了二值化神经网络和知识蒸馏相结合的效果。
Apr, 2019
这篇论文提出了 HigherHRNet,一种新的从下往上的人体姿态估计方法,使用高分辨率特征金字塔学习尺度感知表示,具有多分辨率监督训练和多分辨率聚合推理的能力,能够解决下向多人姿势估计中的尺度变化挑战,从而更精确地定位关键点,尤其适用于小尺寸人体,实现了比以前最好的下向方法在 COCO test-dev 中中等人体上 2.5% AP 的提高。在 CrowdPose test 上,HigherHRNet 甚至超过了所有自上而下的方法,表明其在拥挤场景中具有鲁棒性。
Aug, 2019
本研究提出了 EfficientHRNet,这是一系列轻量级多人姿势估计器,能够在资源受限设备上实时执行姿势估计操作。通过将模型缩放的最新进展与高分辨率特征表示的统一,EfficientHRNet 在降低计算量的同时创建高度准确的模型,最大的模型能够在 1/3 的计算量和 1/3 的功率的情况下,实现与现有最先进水平相近的精度。
Jul, 2020
通过在高分辨率网络中引入动态轻量化、多尺度上下文信息提取、长距离空间依赖建模的方法,本文提出了一种动态轻量化高分辨率网络模型(Dite-HRNet),该模型在 COCO 和 MPII 人体姿态估计数据集上取得了优异的表现,超越了现有的轻量化网络模型。
Apr, 2022
本论文提出了高效高分辨率网络 Lite-HRNet,通过条件通道加权替代 shuffle blocks 中的昂贵的逐点(1x1)卷积来提高轻量级网络,对人体姿势估计和语义分割任务都能提供卓越的结果。
Apr, 2021
通过使用 Binarized Dual Residual Network (BiDRN) 量化方法,本文在资源有限的边缘设备上以 22.1% 的参数和 14.8% 的运算量实现了与全精度方法 Hand4Whole 相当的性能,且在 3D 全身人体网格恢复任务中显著提高了与最先进的二值化算法相比的效果。
Nov, 2023
提出了一种名为 Multi-Instance Pose Network (MIPNet) 的人体姿势估计模型,能够在给定边框范围内预测多个 2D 姿态实例,并引入了一种称为多实例调制块(Multi-Instance Modulation Block,MIMB)的方法来适应性地调制每个实例的通道特征响应,与以往方法相比,在复杂场景中取得了显著的性能提升。
Jan, 2021
本文提出了一种具有轻量、紧凑和适用于适用于计算资源有限应用的体系结构,并在人体姿势估计和面部对齐等定位任务上,详细研究了神经网络二值化的效果,提出了多种正交方法来提高性能,在此基础上,提出了一种新的分层、并行和多尺度残差架构,同时具有与标准瓶颈块相同数量的参数,从而填补了原始网络与其二值化对应物之间的差距,大幅提高了性能,并在人体姿势估计和面部对齐等最具挑战性的数据集上获得了最前沿的表现,同时探究了其性质与性能,并支持关于面部部分分割的其他结果。
Aug, 2018
这篇研究论文提出了一种高效率视觉变压器(HEViTPose)用于人体姿势估计,通过特征分组、空间降级机制及多维度注意力头保持特征多样性。通过优化模型的 Patch Embedded Overlap Width,实现了性能、参数和 GFLOPs 的改进,与最先进模型相当,但更轻量化。
Nov, 2023