面向有限资源的二值化卷积关键点定位器用于人体姿态估计和面部对齐
本文提出了一种具有轻量、紧凑和适用于适用于计算资源有限应用的体系结构,并在人体姿势估计和面部对齐等定位任务上,详细研究了神经网络二值化的效果,提出了多种正交方法来提高性能,在此基础上,提出了一种新的分层、并行和多尺度残差架构,同时具有与标准瓶颈块相同数量的参数,从而填补了原始网络与其二值化对应物之间的差距,大幅提高了性能,并在人体姿势估计和面部对齐等最具挑战性的数据集上获得了最前沿的表现,同时探究了其性质与性能,并支持关于面部部分分割的其他结果。
Aug, 2018
通过结构感知的全卷积网络以及 GAN 的显式 / 隐式学习策略,该论文提出了一种解决单目图像中姿态估计问题的方法,并在 2D 和 3D 姿态估计以及人脸重要标识等相关任务上显著优于现有方法。
Nov, 2017
本篇论文提出一系列工程技术来改善二值化神经网络的准确性,包括更合适的激活函数、反向初始化、渐进式量化、网络叠加等,并在人体姿态估计和 ImageNet 大规模图像识别任务中验证了其优越性。此外,还首次探讨了二值化神经网络和知识蒸馏相结合的效果。
Apr, 2019
通过使用 Binarized Dual Residual Network (BiDRN) 量化方法,本文在资源有限的边缘设备上以 22.1% 的参数和 14.8% 的运算量实现了与全精度方法 Hand4Whole 相当的性能,且在 3D 全身人体网格恢复任务中显著提高了与最先进的二值化算法相比的效果。
Nov, 2023
在本研究中,提出了一种名为 BiHRNet(Binary HRNet)的二值人体姿势估计器,该估计器在适应二值神经网络(BNN)的同时保留了 HRNet 的关键点提取能力,通过提出二值网络训练过程的优化方法以及设计更适合二值化的结构,实现了更少的计算资源开销和精度下降,并在实验中取得了较好的性能。
Nov, 2023
本文提出了一种新的基于卷积神经网络的人体姿势估计的架构和改进的学习技术,能够学习底层特征和高级弱空间模型,在姿态估计中比现有传统架构实现了显著改善。同时,本文探讨了一些研究中发现的经验教训,表明在一些情况下,甚至仅涵盖图像中的几个像素的特征检测器也可以产生出强的特征检测结果,并且高级空间模型对姿势估计的改善效果相对较小。本文的主要贡献在于展示了一种特定变体的深度学习可以在该任务上胜过所有现有传统架构。
Dec, 2013
本文提出一种利用深度图像结合卷积神经网络实现快速且可靠的多人姿态估计算法的方案,可以有效地应用于人机交互领域;具体贡献包括提出了基于残差块的快速网络、构建了包括 170k 多张人体合成图像与真实标注数据在内的公开数据集用于评估,证明了该模型在真实数据上性能良好。
Oct, 2019
本文提出了一种简单、轻量级的人体姿态估计方法 LPN,它采用深度可分离卷积和注意力机制来设计轻量级的 bottleneck 模块,并基于此设计了 LPN 网络。我们的网络仅有 SimpleBaseline(ResNet50)大小的 9% 和复杂度的 11%,并提出了迭代训练和模型无关的 Beta-Soft-Argmax 后处理方法,在 COCO 关键点检测数据集上达到了较高的精度和效率
Nov, 2019