Nov, 2023

Pose Anything: 基于图结构的类别无关姿态估计方法

TL;DR传统的 2D 姿态估计模型局限于其特定类别的设计,限定了其适用范围,对于新颖对象缺乏相关训练数据的情况尤其具有挑战性。为了应对这一局限性,引入了无类别限制的姿态估计(CAPE)方法,在仅需标注关键点的最小支持图像的情况下,实现了任意对象类别的关键点定位。我们提出了一种利用新设计的图转换解码器的 CAPE 新方法,通过捕捉和整合关键点之间固有的几何关系信息,进一步提高了关键点定位的准确性,与传统 CAPE 技术将关键点视为孤立实体的方式存在显著区别。我们在包含超过 100 个类别的 20,000 多张图像的 MP-100 基准数据集上验证了我们的方法,与之前最先进的方法相比,本方法在 1-shot 和 5-shot 设置下均取得了显著的改进,分别达到了 2.16%和 1.82%的提升。此外,与之前的 CAPE 方法相比,我们的方法的端对端训练表现出良好的可扩展性和效率。