IJCAIMay, 2022

AggPose:基于深度聚合视觉 Transformer 的婴儿姿势估计

TL;DR本文提出了婴儿姿势数据集和基于注意力机制和多尺度融合的深度聚合视觉 Transformer,称为 AggPose,使用 COCO 姿势数据集预训练 AggPose,然后在我们新发布的大规模婴儿姿势估计数据集上运用该模型,结果显示 AggPose 能够有效地学习不同分辨率之间的多尺度特征,从而显著提高了婴儿姿势估计的性能,并且在婴儿姿势估计数据集中优于 HRFormer 和 TokenPose。