面向有限资源的二值化卷积关键点定位器用于人体姿态估计和面部对齐

ICCVMar, 2017

面向有限资源的二值化卷积关键点定位器用于人体姿态估计和面部对齐

Binarized Convolutional Landmark Localizers for Human Pose Estimation and Face Alignment with Limited Resources

Adrian Bulat, Georgios Tzimiropoulos

TL;DR探讨神经网络二值化在人体姿态估计和面部对齐任务中的效果，提出了一种新的分层，平行和多尺度残差架构，该架构在性能方面具有显著改进，并在人体姿态估计和面部对齐任务中进行了实验，表现优异。

Abstract

Our goal is to design architectures that retain the groundbreaking performance of CNNs for landmark localization and at the same time are lightweight, compact and suitable for applications with limited computational resources. To this end, we make the following contributions: (a) we are the first to study the effect of →

neural network binarization human pose estimation face alignment hierarchical parallel multi-scale residual architecture ablation studies

发现论文，激发创造

利用有限资源的分层二元卷积神经网络进行关键点定位

本文提出了一种具有轻量、紧凑和适用于适用于计算资源有限应用的体系结构，并在人体姿势估计和面部对齐等定位任务上，详细研究了神经网络二值化的效果，提出了多种正交方法来提高性能，在此基础上，提出了一种新的分层、并行和多尺度残差架构，同时具有与标准瓶颈块相同数量的参数，从而填补了原始网络与其二值化对应物之间的差距，大幅提高了性能，并在人体姿势估计和面部对齐等最具挑战性的数据集上获得了最前沿的表现，同时探究了其性质与性能，并支持关于面部部分分割的其他结果。

Aug, 2018

构造感知完全卷积神经网络的对抗学习用于地标定位

通过结构感知的全卷积网络以及 GAN 的显式 / 隐式学习策略，该论文提出了一种解决单目图像中姿态估计问题的方法，并在 2D 和 3D 姿态估计以及人脸重要标识等相关任务上显著优于现有方法。

Nov, 2017

卷积神经网络实现高效的物体定位

通过深度卷积网络及位置细化模型使人体姿态的关节定位精度得到提升

Nov, 2014

用于人体姿态估计和图像识别的二进制网络的改进训练

本篇论文提出一系列工程技术来改善二值化神经网络的准确性，包括更合适的激活函数、反向初始化、渐进式量化、网络叠加等，并在人体姿态估计和 ImageNet 大规模图像识别任务中验证了其优越性。此外，还首次探讨了二值化神经网络和知识蒸馏相结合的效果。

Apr, 2019

二值化三维全身人体网格恢复

通过使用 Binarized Dual Residual Network (BiDRN) 量化方法，本文在资源有限的边缘设备上以 22.1% 的参数和 14.8% 的运算量实现了与全精度方法 Hand4Whole 相当的性能，且在 3D 全身人体网格恢复任务中显著提高了与最先进的二值化算法相比的效果。

Nov, 2023

BiHRNet：用于人体姿势估计的二进制高分辨率网络

在本研究中，提出了一种名为 BiHRNet（Binary HRNet）的二值人体姿势估计器，该估计器在适应二值神经网络（BNN）的同时保留了 HRNet 的关键点提取能力，通过提出二值网络训练过程的优化方法以及设计更适合二值化的结构，实现了更少的计算资源开销和精度下降，并在实验中取得了较好的性能。

Nov, 2023

使用卷积网络学习人体姿势估计特征

本文提出了一种新的基于卷积神经网络的人体姿势估计的架构和改进的学习技术，能够学习底层特征和高级弱空间模型，在姿态估计中比现有传统架构实现了显著改善。同时，本文探讨了一些研究中发现的经验教训，表明在一些情况下，甚至仅涵盖图像中的几个像素的特征检测器也可以产生出强的特征检测结果，并且高级空间模型对姿势估计的改善效果相对较小。本文的主要贡献在于展示了一种特定变体的深度学习可以在该任务上胜过所有现有传统架构。

Dec, 2013

基于深度的实时卷积网络人体姿势估计

本文提出一种利用深度图像结合卷积神经网络实现快速且可靠的多人姿态估计算法的方案，可以有效地应用于人机交互领域；具体贡献包括提出了基于残差块的快速网络、构建了包括 170k 多张人体合成图像与真实标注数据在内的公开数据集用于评估，证明了该模型在真实数据上性能良好。

Oct, 2019

基于地标引导的语义部件分割的 CNN 级联

本文提出一种卷积神经网络级联架构，利用关键点嵌套的姿态特定信息进行语义部件分割，经测试该网络在面部数据集上具有较高性能。

Sep, 2016

简单轻量级人体姿态估计

本文提出了一种简单、轻量级的人体姿态估计方法 LPN，它采用深度可分离卷积和注意力机制来设计轻量级的 bottleneck 模块，并基于此设计了 LPN 网络。我们的网络仅有 SimpleBaseline（ResNet50）大小的 9% 和复杂度的 11%，并提出了迭代训练和模型无关的 Beta-Soft-Argmax 后处理方法，在 COCO 关键点检测数据集上达到了较高的精度和效率

Nov, 2019