Apr, 2024

SMPLer:针对单目 3D 人体形状和姿势估计的 Transformer 模型改进

TL;DR通过引入两个关键元素,即分离的注意力操作和基于 SMPL 的目标表示,本文提出了一种面向 SMPL 的 Transformer 框架(SMPLer),通过有效利用 Transformer 中的高分辨率特征来解决了现有 monocular 3D human shape 和 pose estimation 模型在计算和内存复杂度方面的问题,并通过多个新模块进一步提高重建性能。在实验证明了 SMPLer 在量化和定性方面都比现有的 3D human shape 和 pose estimation 方法效果更好,其中在 Human3.6M 数据集上实现了 45.2 毫米的平均关节定位误差,相较于 Mesh Graphormer 提升了 10% 以上且参数数量不到三分之一。