AggPose：基于深度聚合视觉 Transformer 的婴儿姿势估计

IJCAIMay, 2022

AggPose：基于深度聚合视觉 Transformer 的婴儿姿势估计

AggPose: Deep Aggregation Vision Transformer for Infant Pose Estimation

Xu Cao, Xiaoye Li, Liya Ma, Yi Huang, Xuan Feng...

TL;DR本文提出了婴儿姿势数据集和基于注意力机制和多尺度融合的深度聚合视觉 Transformer，称为 AggPose，使用 COCO 姿势数据集预训练 AggPose，然后在我们新发布的大规模婴儿姿势估计数据集上运用该模型，结果显示 AggPose 能够有效地学习不同分辨率之间的多尺度特征，从而显著提高了婴儿姿势估计的性能，并且在婴儿姿势估计数据集中优于 HRFormer 和 TokenPose。

Abstract

Movement and pose assessment of newborns lets experienced pediatricians predict neurodevelopmental disorders, allowing early intervention for related diseases. However, most of the newest →

newborns neurodevelopmental disorders ai approaches infant pose dataset deep aggregation vision transformer

发现论文，激发创造

视频中自动婴儿二维姿势估计：比较七种深度神经网络方法

通过比较七种不同的姿势估计方法，对婴儿在仰卧位的视频进行分析，发现除了 DeepLabCut 和 MediaPipe 外，其他方法在无需微调的情况下都表现出竞争力，其中 ViTPose 表现最佳。同时，引入颈中臀比例的错误和其他误测、多余检测以及不同方法的内部置信度评分可靠性的研究，这些都对下游任务有重要意义。

Jun, 2024

利用小数据进行婴儿姿态估计的不变表示学习

本文为解决婴儿动作分析领域中遇到的问题，构建了一个 SyRIP 数据集，提出了一种多阶段不变表示学习策略并进行 fine-tuned 来做域自适应的婴儿姿势估计，经实验证明该方法在当代最先进的 DarkPose 模型上的性能最佳，mAP 达到 93.6。

Oct, 2020

高效的多目标姿态估计方法：基于多分辨率可变形注意力和查询聚合

使用多分辨率可变形注意力和查询聚合机制的视觉转换器模型在多目标姿态估计方面取得了最先进的结果。

Dec, 2023

基于生成先验的高效领域自适应方法用于 3D 婴儿姿势估计

使用优化方法和生成先验结合对基于小数据集的婴儿 2D 和 3D 姿势估计进行领域自适应，证明 ZeDO-i 方法能够在只有少量数据的情况下获得高效的领域自适应，并在 SyRIP 数据集上取得 43.6 mm、MINI-RGBD 数据集上取得 21.2 mm 的最先进 MPJPE 性能。

Nov, 2023

人体姿态估计的级联特征聚合

本文提出了一种基于卷积神经网络的级联特征聚合方法 (Cascade Feature Aggregation, CFA)，该方法可以有效地提高人体姿态估计的精度，并且在 MPII 数据集和 LIP 数据集上实现了最佳成绩。

Feb, 2019

DeepPose: 使用深度神经网络进行人体姿势估计

本文提出一种基于深度神经网络的人体姿势估计方法，将姿势估计表示为一种基于 DNN 的回归问题，通过级联 DNN 回归器来提高姿势估计的精确性，并在四种不同类型的学术基准测试中取得了优异的实验结果。

Dec, 2013

TransPose: 一个基于 Transformer 的六自由度物体姿态估计网络与深度修正

该研究提出了一种改进的基于 Transformer 的 6D 位姿估计方法 TransPose，它利用 RGB 图片作为输入，结合轻量级深度估计网络和变压器检测网络，并通过深度细化模块对位姿进行精度优化，在果树采摘应用方面取得了优于其他现有方法的效果。

Jul, 2023

基于 Transformer 的人体姿势直接估计（TFPose）

我们提出了一种人体姿态估计框架，该框架以回归为基础，采用转换器有效地解决了姿态估计任务，使用序列预测问题的方法可以避免热图姿态估计带来的缺陷，并且通过关注机制可以适应地关注与目标关键点最相关的特征，从而大大克服了以前回归方法中存在的特征不对齐问题，而且我们的框架能够固有地利用关键点之间的结构关系，在 MS-COCO 和 MPII 数据集上的实验证明了我们的方法可以显著提高基于回归的姿态估计的最新技术水平，并且表现与最好的基于热图的姿态估计方法相当。

Mar, 2021

基于形状模板变换的无监督人体姿态估计

本文介绍了一种基于可学习的模板匹配和深度学习特征提取方法，以无监督的方式学习人类成人和婴儿的姿势估计器，特别是在医学环境中，这可能是婴儿神经功能障碍的重要生物标志物。

May, 2021

使用空间和时间转换器的三维人体姿势估计

本研究提出一种基于 transformer 的算法，能够在视频中实现 3D 人体姿态估计，通过对空间和时间进行变换，对每一帧中人体关节关系进行建模，并在中心帧上输出准确的 3D 人体姿态，该算法在 Human3.6M 和 MPI-INF-3DHP 数据集上实现了最先进的成果。

Mar, 2021