ECCVJan, 2022

Poseur:基于 Transformer 的直接人体姿势回归

TL;DR提出了一种基于 Transformer 网络的 2D 人体姿势估计方法,直接将图像转换为坐标进行回归预测,并利用自适应注意力机制来提高关键点坐标预测精度,实现了在 MS-COCO 数据集上超越同类方法的目标。