Aug, 2023

图像和视频的三维人体姿态估计的双链约束

TL;DR本文提出了一种名为Double-chain Graph Convolutional Transformer (DC-GCT)的新模型,通过局部到全局和全局到局部的双链设计来约束姿势,并结合GCN和Transformer的优势以及基于自注意机制的局部约束模块和全局约束模块以及特征交互模块来完整捕捉人体关节之间的多级依赖关系,将时间信息引入单帧模型,并在计算成本几乎不增加的情况下通过将目标帧的关节嵌入来指导视频序列嵌入。实验结果表明,DC-GCT在两个具有挑战性的数据集(Human3.6M和MPI-INF-3DHP)上达到了最先进的性能。值得注意的是,我们的模型在Human3.6M数据集的所有动作类别上都使用了CPN检测到的2D姿势,我们的代码可在此URL获取。