Jul, 2024

STGFormer: 基于时空图的三维人体姿势估计视频模型

TL;DR该研究提出了一种融合基于体形结构图的表示和时空信息的时空图神经网络建模框架,以解决视频中三维人体姿势估计中深度模糊所带来的挑战。通过引入融合图信息的注意力机制以及在参数使用和特征学习方面的优化处理,该方法在Human3.6M和MPI-INF-3DHP数据集上实现了领先水平的三维人体姿势估计性能。