本文介绍了一种名为Multi-Stage HRNet的人体姿势估计模型,并采用多阶段网络和交叉阶段特征聚合等技术优化了关键点位置,从而在COCO数据集上取得了77.1 AP得分。
Oct, 2019
通过改进下联式方法,提出了一种改进的多人姿势估计方法,该方法使用更直观却更合理的表示方法,具有 attention 机制的改进型叠叠层沙漏网络,专门用于 hard keypoint 和 keypoint 关联挖掘的新型 Focal L2 Loss 和用于将检测到的关键点分组为单个姿势的强大贪婪关键点分配算法,平均精度比基准线高约 15%,与 MS-COCO 测试数据集上的最新技术相当。
Nov, 2019
提出使用神经网络框架PoseNet3D将二维关节作为输入,输出三维骨架和SMPL体模型参数,通过在学生-教师框架下的学习方法,无需使用任何3D数据进行训练,结果表明与之前的无监督方法相比,该方法将3D关节预测误差降低了18%。
Mar, 2020
本文介绍了基于深度学习的2D和3D人体姿态估计的综述,系统分析和比较了这些解决方案,对研究的挑战,应用和未来方向进行了讨论,包括250多篇研究论文以及姿态估计数据集和评估指标的定量表现比较和讨论。
Dec, 2020
本文提出了一种新型的在线知识蒸馏方法OKDHP,通过多分支网络和特征聚合单元以及像素级Kullback-Leibler散度来保证人体姿态估计的效率和准确性。实验结果表明,该方法在MPII和COCO数据集上表现良好。
Aug, 2021
通过在高分辨率网络中引入动态轻量化、多尺度上下文信息提取、长距离空间依赖建模的方法,本文提出了一种动态轻量化高分辨率网络模型(Dite-HRNet),该模型在 COCO 和 MPII 人体姿态估计数据集上取得了优异的表现,超越了现有的轻量化网络模型。
Apr, 2022
本研究提出了一种名为DWPose的两阶段姿势蒸馏方法,通过权重衰减策略和学生模型自身的蒸馏来提高全身姿势估计的有效性和效率,实验结果表明其在COCO-WholeBody数据集上取得了新的最佳性能,将整体AP从64.8%提升到66.5%,甚至超过了RTMPose-x教师模型的65.3% AP。
Jul, 2023
通过上下文学习来进行骨架序列建模是一种新的视觉与自然语言处理多任务建模方法,本文提出了一种名为Skeleton-in-Context (SiC) 的有效框架用于骨架序列的上下文建模,实现了多种基于骨架的任务的同时执行,并且可以根据给定提示进一步推广到新的未见任务。
Dec, 2023
为解决低质量骨架动作识别问题,本文提出了一个通用的知识蒸馏框架,利用师生模型结构和基于部分的骨架匹配策略,通过多样本对比损失实现从高质量到低质量骨架的知识迁移,进而训练出可以处理低质量骨架的学生模型。实验证明了该知识蒸馏框架的有效性。
Apr, 2024
通过知识蒸馏实现不同分辨率模型的性能提升,包括构建一个跨领域知识蒸馏框架,以及使用尺度自适应的投影仪集合模块来空间对齐输入分辨率不同的模型的特征图,进一步通过交叉类别对齐模块和从易到难的训练策略提高蒸馏性能。在MPII和COCO两个常见基准数据集上进行了大量实验证明了我们方法的有效性和效率。
May, 2024