通过改进下联式方法,提出了一种改进的多人姿势估计方法,该方法使用更直观却更合理的表示方法,具有 attention 机制的改进型叠叠层沙漏网络,专门用于 hard keypoint 和 keypoint 关联挖掘的新型 Focal L2 Loss 和用于将检测到的关键点分组为单个姿势的强大贪婪关键点分配算法,平均精度比基准线高约 15%,与 MS-COCO 测试数据集上的最新技术相当。
Nov, 2019
本文提出了一种新颖的领域适应方法,用于多人姿态估计,以进行人类级别的拓扑结构对齐和细粒度特征对齐。通过三个模块实现:交叉注意力特征对齐(CAFA),域内结构自适应(ISA)和域间人 - 拓扑对齐(IHTA)模块,证明了该算法优于现有最佳算法。
Aug, 2020
本研究提出了一种端到端训练的回归方法,使用 Soft-argmax 函数将特征映射直接转换为关节坐标,避免了人工生成的基准图像,使得上下文信息可以无缝地包含在姿势预测中。实验证明该方法在人类姿势估计方面具有较高性能,可应用于多种复杂数据集。
Oct, 2017
人机交互中的以人为中心的视觉理解是一个重要的目标,本研究提出了一种新颖的基于语言的姿势推断策略,称为 LAMP,通过利用由语言模型生成的文本表示,LAMP 能够在实例级和关节级对姿势进行理解,并学习到更稳健的视觉表示,以应对多人姿态估计中的遮挡挑战。实验证明,语言监督训练提升了单阶段多人姿态估计的性能,实例级和关节级的提示对训练都是有价值的。
Jul, 2023
该研究提出了基于深度卷积去卷积模型的鲁棒人体姿态估计方法,通过多尺度的上下文监督和全局回归的方式增强模型的姿态鲁棒性,并在 MPII 和 FLIC 数据集上展示了具有竞争力的性能。
Aug, 2018
本文介绍了一种基于向下拼接的人体姿态估计框架,其中通过关键点检测和聚类两个阶段进行处理。在该框架下,本文提出了多种方案,包括使用关键点热图进行像素级别的关键点回归、采用像素级别空间变换网络学习适应性表示处理尺度和方向差异并提高关键点回归质量,以及使用联合形状和热值评分方案提升预测姿态的可靠性,最终获得了最先进的人体底部向上姿态估计结果。
Jun, 2020
该研究提出了一种基于卷积神经网络的全局关系建模和多分支特征对齐的多人姿态估计方法,相较于现有方法具有更强的本地和全局处理能力和更高的估计性能。
Mar, 2023
本文介绍了一种从多个校准相机视角估计多个人的 3D 姿势的方法,通过使用图神经网络以及特定任务的模块实现了高性能、低计算复杂度的结果。
Sep, 2021
本文提出了一种更加紧凑和高效的多人姿态估计框架,使用自适应点集来表示人体部位并使用单阶段网络精细地回归多人姿态,在 COCO 测试开发数据集上实现了最佳速度 - 准确度平衡。
Dec, 2021
本研究提出了一种用于人体关键点检测的有效网络结构、三种有效的训练策略和四种有用的后处理技术,通过积极利用丰富的非标记数据和上下文信息来提高检测准确性,从各个方面解决了由于遮挡、模糊、光照和尺度差异等因素所导致的挑战性问题,并在 MS COCO 关键点检测基准测试上取得了领先于其他参考方法的结果。
Feb, 2020