Oct, 2022

利用基于Transformer的融合网络探索联合动作协同性用于3D人体姿态估计

TL;DR提出了一种名为Fusionformer的方法用于3D人体姿态估计任务,通过引入自身轨迹模块、互相轨迹模块和全局空间时间特征以及局部关节轨迹特征的融合,最终通过姿势精炼网络来平衡3D投影的一致性,并在两个基准数据集上进行评估,结果表明与基线方法poseformer相比,在Human3.6M数据集上分别提高了2.4%的MPJPE和4.3%的P-MPJPE。