ECCVSep, 2022

单目和多视角人体姿态估计的 token - 修剪关键点变换器

TL;DR该论文提出了一种基于 Transformer 的 2D 人体姿态估计方法 ——Token-Pruned Pose Transformer(PPT)及其多视点姿态估计扩展,使用自我注意力仅在选定的标记中进行计算,采用一种名为人体区域融合的新的跨视图融合策略,通过在多视角中对来自多视点的提示进行高效融合,进而实现了与以前人体姿态 Transformer 方法相同的准确度,同时减少了计算量,并在 Human 3.6M 和 Ski-Pose 数据集上取得了新的最优结果。