基于卷积部位热图回归的人体姿态估计
本文提出了一种新颖的 ConvNet 模型,可预测图像中的 2D 人体姿势,通过回归每个关键点的热度图表示,并能够学习和表示部件外观和配置上下文。模型可以从头开始和端到端训练,用于改善性能的辅助损失。该模型在两个基准数据集上进行了评估,具有与最先进技术相当的性能,但不含有图形模型阶段(或层)的复杂性。
May, 2016
本文提出了一种新的基于卷积神经网络的人体姿势估计的架构和改进的学习技术,能够学习底层特征和高级弱空间模型,在姿态估计中比现有传统架构实现了显著改善。同时,本文探讨了一些研究中发现的经验教训,表明在一些情况下,甚至仅涵盖图像中的几个像素的特征检测器也可以产生出强的特征检测结果,并且高级空间模型对姿势估计的改善效果相对较小。本文的主要贡献在于展示了一种特定变体的深度学习可以在该任务上胜过所有现有传统架构。
Dec, 2013
本研究提出了一种端到端训练的回归方法,使用 Soft-argmax 函数将特征映射直接转换为关节坐标,避免了人工生成的基准图像,使得上下文信息可以无缝地包含在姿势预测中。实验证明该方法在人类姿势估计方面具有较高性能,可应用于多种复杂数据集。
Oct, 2017
本文提出了一个异构多任务学习框架,用于通过深度卷积神经网络从单 ocular 图像中实现人体姿势估计,同时学习姿势 - 关节回归器和滑动窗口身体部位检测器,并证明包含身体部位检测任务有助于正则化网络,并指导其收敛于良好解决方案,并在多个数据集上报告了竞争和最先进的结果。 还通过实验证明,我们的网络中间层中学习的神经元针对局部身体部位进行了优化。
Jun, 2014
该研究通过 CNN 回归框架提出了适当的表示、数据增强和损失函数来捕捉姿态空间的几何信息,将 3D 姿态估计问题转化为回归问题,并在 PASCAL3D + 数据集上得到与同类最优方法相当的性能表现。
Aug, 2017
本文介绍了一种使用级联 Transformer 的基于回归的姿势识别方法,利用编码器 - 解码器结构实现了人体和关键点检测的回归,通过不同自注意力层中的关键点假设改进来展示了 Transformer 中的递归自注意力机制,并与竞争的回归方法进行比较得到了有竞争力的结果。
Apr, 2021
该研究提出了基于深度卷积去卷积模型的鲁棒人体姿态估计方法,通过多尺度的上下文监督和全局回归的方式增强模型的姿态鲁棒性,并在 MPII 和 FLIC 数据集上展示了具有竞争力的性能。
Aug, 2018
本研究提出了一个称为 HybridPose 的混合模型,通过最大化两种方法的优点来互相克服它们的缺点,同时引入自相关损失来注入关键点坐标和可见性之间的空间依赖性,从而在不降低姿势估计准确性的情况下展示了关键点的可见性。
May, 2023
本文提出一种多任务学习框架,采用深度神经网络进行实现,用于从静止深度图像中预测人体姿态,并使用 MatchNet 协助推断。在大规模数据集上的实验证明该框架可以显著提高人体姿态估计的准确度。
Aug, 2016