CVPRApr, 2023

A2J-Transformer: 基于 Anchor-to-Joint Transformer 网络的单 RGB 图像 3D 互动手部姿态估计

TL;DR利用 Transformer 的 non-local encoding-decoding 框架扩展 A2J,将其应用于 RGB 领域下的二手交互状态下的 3D 手势姿势估计,提出 A2J-Transformer 模型来提供局部和全局的姿态线索,并实现了最先进的免模型性能。