本文提出了一种简单、轻量级的人体姿态估计方法 LPN,它采用深度可分离卷积和注意力机制来设计轻量级的 bottleneck 模块,并基于此设计了 LPN 网络。我们的网络仅有 SimpleBaseline(ResNet50)大小的 9% 和复杂度的 11%,并提出了迭代训练和模型无关的 Beta-Soft-Argmax 后处理方法,在 COCO 关键点检测数据集上达到了较高的精度和效率
Nov, 2019
这篇研究论文提出了一种高效率视觉变压器(HEViTPose)用于人体姿势估计,通过特征分组、空间降级机制及多维度注意力头保持特征多样性。通过优化模型的 Patch Embedded Overlap Width,实现了性能、参数和 GFLOPs 的改进,与最先进模型相当,但更轻量化。
Nov, 2023
本文提出了一种基于图表的变形网络,实现了从二维人体姿态到三维人体姿态的估计和到三维人体网格参数的回归。该方法在保证精度的同时,优化了计算效率,具有广泛的实际应用价值。
Jan, 2023
通过深度学习的多任务方法,提出了一种可以同时处理头部姿势、人脸对准和可见性的网络结构,相比现有技术,在头部姿势和可见性方面均取得了最佳表现,在人脸对准方面也达到了和现有技术同等的状态。
Feb, 2022
本文介绍了一种使用 LiDAR 和 3D 注释的姿势估计方法 LPFormer,该方法使用第一阶段的多级特征表示检测人类边界框并提取特征表示,第二阶段的基于 Transformer 的网络使用这些特征来回归人体关键点,并在 Waymo Open 数据集上获得了最佳性能和改进。
Jun, 2023
本研究提出了 EfficientHRNet,这是一系列轻量级多人姿势估计器,能够在资源受限设备上实时执行姿势估计操作。通过将模型缩放的最新进展与高分辨率特征表示的统一,EfficientHRNet 在降低计算量的同时创建高度准确的模型,最大的模型能够在 1/3 的计算量和 1/3 的功率的情况下,实现与现有最先进水平相近的精度。
Jul, 2020
本文研究如何设计有效的单支脚神经网络用于在边缘设备上进行实时多人姿态估计,移除高分辨率分支,增强模型容量并大大减少计算成本,提高了姿态估计的效率和性能。
May, 2022
我们设计了一个端到端的头部姿势估计网络,可从单个 RGB 图像预测欧拉角的全范围头部偏航。WHENet 是第一个适用于完整头部偏航范围的细粒度现代方法,同时也满足或超越了前沿的头部姿态估计方法。
May, 2020
使用卷积神经网络从头部图像直接预测欧拉角度量(偏航角,俯仰角和横滚角),以代替传统的人头模型法进行姿态估计,并在常用数据集上取得了最优结果。
Oct, 2017
提出了一种新的深度学习方法,用于处理遮挡下的头部姿态估计问题,该方法通过潜在空间回归来更好地解决遮挡场景下的问题,实现了超越多种当前最先进遮挡下头部姿态估计方法的性能,并在非遮挡场景下达到了类似的准确度。