Aug, 2023

图像和视频的三维人体姿态估计的双链约束

TL;DR本文提出了一种名为 Double-chain Graph Convolutional Transformer (DC-GCT) 的新模型,通过局部到全局和全局到局部的双链设计来约束姿势,并结合 GCN 和 Transformer 的优势以及基于自注意机制的局部约束模块和全局约束模块以及特征交互模块来完整捕捉人体关节之间的多级依赖关系,将时间信息引入单帧模型,并在计算成本几乎不增加的情况下通过将目标帧的关节嵌入来指导视频序列嵌入。实验结果表明,DC-GCT 在两个具有挑战性的数据集(Human3.6M 和 MPI-INF-3DHP)上达到了最先进的性能。值得注意的是,我们的模型在 Human3.6M 数据集的所有动作类别上都使用了 CPN 检测到的 2D 姿势,我们的代码可在此 URL 获取。