深度高分辨率表示学习人体姿态估计
High-Resolution Network (HRNet) is a new computer vision framework that maintains high-resolution representations through the whole process, resulting in semantically richer and spatially more precise representations, which outperforms existing state-of-the-art frameworks in human pose estimation, semantic segmentation, and object detection.
Aug, 2019
这篇论文提出了 HigherHRNet,一种新的从下往上的人体姿态估计方法,使用高分辨率特征金字塔学习尺度感知表示,具有多分辨率监督训练和多分辨率聚合推理的能力,能够解决下向多人姿势估计中的尺度变化挑战,从而更精确地定位关键点,尤其适用于小尺寸人体,实现了比以前最好的下向方法在 COCO test-dev 中中等人体上 2.5% AP 的提高。在 CrowdPose test 上,HigherHRNet 甚至超过了所有自上而下的方法,表明其在拥挤场景中具有鲁棒性。
Aug, 2019
本文介绍了一种名为 Multi-Stage HRNet 的人体姿势估计模型,并采用多阶段网络和交叉阶段特征聚合等技术优化了关键点位置,从而在 COCO 数据集上取得了 77.1 AP 得分。
Oct, 2019
本文提出了一种新颖的 ConvNet 模型,可预测图像中的 2D 人体姿势,通过回归每个关键点的热度图表示,并能够学习和表示部件外观和配置上下文。模型可以从头开始和端到端训练,用于改善性能的辅助损失。该模型在两个基准数据集上进行了评估,具有与最先进技术相当的性能,但不含有图形模型阶段(或层)的复杂性。
May, 2016
该研究提出了基于深度卷积去卷积模型的鲁棒人体姿态估计方法,通过多尺度的上下文监督和全局回归的方式增强模型的姿态鲁棒性,并在 MPII 和 FLIC 数据集上展示了具有竞争力的性能。
Aug, 2018
本论文对高分辨率表示学习进行进一步的研究,并通过在各种视觉任务中应用简单而有效的修改来增强高分辨率表示,实验表明,这种方法优于现有的方法,并在 Cityscapes、LIP 和 PASCAL Context 等数据集上取得了最佳结果。此外,本论文构建了一个多层表示,并将其应用于 Faster R-CNN 目标检测框架以及拓展框架,并在 COCO 目标检测上实现了超越现有单模型网络的卓越表现。
Apr, 2019
本文提出一种基于深度神经网络的人体姿势估计方法,将姿势估计表示为一种基于 DNN 的回归问题,通过级联 DNN 回归器来提高姿势估计的精确性,并在四种不同类型的学术基准测试中取得了优异的实验结果。
Dec, 2013
本文提出一种利用深度图像结合卷积神经网络实现快速且可靠的多人姿态估计算法的方案,可以有效地应用于人机交互领域;具体贡献包括提出了基于残差块的快速网络、构建了包括 170k 多张人体合成图像与真实标注数据在内的公开数据集用于评估,证明了该模型在真实数据上性能良好。
Oct, 2019
本文提出了一种名为 RSC-Net 的算法,通过分辨率感知网络、自监督损失和对比学习方案来学习跨分辨率的三维人体姿态和形状,并通过低分辨率输入进行重建,优于现有的方法。
Mar, 2021