I^2R-Net:用于多人姿态估计的人际内和外关系网络
本文提出了一种基于整数线性规划的方法来解决多人姿态估计的问题,并且在 MPII 人体多人姿态数据集上实现了与最先进方法相当的精度,但速度快了 6,000 到 19,000 倍。
Aug, 2016
本文提出了一种特别设计用于多人姿势估计的双路网络,着重于回归关键点和连肢矢量,与现有的 openpose 网络在模型大小、前向速度和估计精度方面进行了比较。
Oct, 2017
本文介绍了一种称为MultiPoseNet的新型底层多人姿态估计架构,它结合了多任务模型和新型分配方法,可同时处理人物检测、关键点检测、人物分割和姿态估计问题,并在COCO关键点数据集上超越了所有先前的底层方法,具有更高的精度和更快的速度,在至少4倍的速度下与最佳的自上而下方法相当。
Jul, 2018
本文介绍了一种利用人体姿态提示的多层次关系检测策略,通过深度学习的方法将人体姿态融入到三个语义层面的关系表示中,以解决人体场景中精细化的物体交互识别问题。实验证明本方法在公共基准测试中表现优异。
Sep, 2019
本文介绍了一种名为Multi-Stage HRNet的人体姿势估计模型,并采用多阶段网络和交叉阶段特征聚合等技术优化了关键点位置,从而在COCO数据集上取得了77.1 AP得分。
Oct, 2019
本研究提出了EfficientHRNet,这是一系列轻量级多人姿势估计器,能够在资源受限设备上实时执行姿势估计操作。通过将模型缩放的最新进展与高分辨率特征表示的统一,EfficientHRNet在降低计算量的同时创建高度准确的模型,最大的模型能够在1/3的计算量和1/3的功率的情况下,实现与现有最先进水平相近的精度。
Jul, 2020
本文提出了Hierarchical Multi-person Ordinal Relations (HMOR) 的方法来解决 monocular RGB 相机下 3D multi-person 姿态估计问题,通过构建一个多层的ordinal relation 层级结构从而提高了模型的全局连贯性,进而设计了一套集成的 top-down 模型,在 coarse-to-fine 的框架下同时估计bounding boxes, depths和 root-relative 3D poses,以此达到更加精确的深度估计。与之前的SOTA方法相比,本文的方法在公开的多人3D姿势数据集上取得了显著的优势,且计算复杂度更低、模型参数更少。
Aug, 2020
我们引入了一种新颖的一阶段端到端的多人2D姿态估计算法,称为联合坐标回归和关联(JCRA),它能够在不需要任何后处理的情况下生成人体姿势关节和关联。提出的算法快速、准确、有效、简单,具有利用端到端网络架构显著提高推理速度的特点。同时,我们为编码器和解码器设计了对称的网络结构,确保可以高精度地识别关键点。它遵循通过转换网络直接输出部分位置的架构,从而在性能方面有了显着改进。在MS COCO和CrowdPose基准测试上进行了广泛的实验,结果表明JCRA在精度和效率方面均优于现有技术。此外,JCRA在推理加速方面比先前最先进的自底向上算法快78%,并且该算法的代码将公开发布。
Jul, 2023
本文介绍了一种名为双通道分层关系网络 (DHRNet) 的新型基于卷积神经网络的单阶段方法,能够同时提取实例到关节和关节到实例之间的交互信息,通过整合不同相关建模分支的优点,丰富了交互信息,并且通过利用其他实例和关节的信息在关节定位方面表现出色,对于多人姿势估计 (MPPE) 提出了一种有效的解决方案。
Apr, 2024