Sep, 2022

单目和多视角人体姿态估计的token-修剪关键点变换器

TL;DR该论文提出了一种基于Transformer的2D人体姿态估计方法——Token-Pruned Pose Transformer(PPT)及其多视点姿态估计扩展,使用自我注意力仅在选定的标记中进行计算,采用一种名为人体区域融合的新的跨视图融合策略,通过在多视角中对来自多视点的提示进行高效融合,进而实现了与以前人体姿态Transformer方法相同的准确度,同时减少了计算量,并在Human 3.6M和Ski-Pose数据集上取得了新的最优结果。