多跳图变换网络用于3D人体姿势估计

May, 2024

多跳图变换网络用于3D人体姿势估计

Multi-hop graph transformer network for 3D human pose estimation

Zaedul Islam, A. Ben Hamza

TL;DR介绍了一个用于视频中2D到3D人体姿势估计的多跳图变换网络，通过利用多头自注意力和多跳图卷积网络的优势以捕获时空依赖关系和处理远距离交互，提出了一个模型架构来实现准确的全局和局部依赖关系捕捉以及处理所需的空间细节，实验结果表明其有效性和泛化能力。

Abstract

Accurate 3d human pose estimation is a challenging task due to occlusion and depth ambiguity. In this paper, we introduce a multi-hop graph transformer network designed for 2D-to-→

发现论文，激发创造

三维单目视频多人姿势估计的图形和时间卷积网络

提出了一种新的框架，将图卷积神经网络（GCNs）和时间卷积神经网络（TCNs）相结合，以强韧地估计无需摄像机参数即可实现相机中心多人3D姿态的方法。该方法利用可见关节和骨头信息来估计遮挡或缺失的人体部分信息，并结合使用GCNs和TCNs的方法。定量和定性评估表明，所提出的方法具有实际应用效果。

Dec, 2020

基于图形堆叠沙漏网络的三维人体姿态估计

本文提出了一种新的图卷积神经网络架构，用于2D到3D人体姿态估计任务，并使用多尺度、多级别特征表示的多尺度架构进行了实验，结果表明该模型优于现有技术，并取得了更好的表现。

Mar, 2021

条件有向图卷积用于三维人体姿态估计

本文提出一种基于有向图模型的U型结构的条件有向图卷积网络，用于从单目视频中进行3D人体姿势估计，实验结果表明有向图模型可以更好地利用人体骨骼的层次结构，而条件连接可以为不同的姿态产生自适应的图拓扑。

Jul, 2021

ConvFormer: 利用动态多头卷积注意力实现 Transformer 模型的参数减少，用于 3D 人体姿势估计

本文提出了ConvFormer：一种新型的卷积变压器，新增了一种动态的多头卷积自注意机制用于单目3D人体姿势估计。通过对人体各关节点之间的关系进行建模，利用时间关节特征的新概念进行完全的时间信息融合，成功地在三个基准数据集上实现了SOTA水平的结果，相对于以前的变压器模型取得了显著的参数降低。

Apr, 2023

交织图与注意力网络用于三维人体姿势估计

本文介绍了利用Interweaved Graph and Attention Network技术来进行从单视图图像中进行3D人体姿势估计的方法，结果表明该方法在Human3.6M和MPI-INF-3DHP两个流行的基准数据集上均达到了最先进的表现。

Apr, 2023

3D人体姿态估计的正则分割图网络

本文提出了一种基于高阶正则分裂图网络（RS-Net）的2D-to-3D人体姿态估计方法，通过矩阵分裂和权重调节等方法来捕捉贯穿身体骨骼的长距离依赖，并学习不同的调制向量和调制矩阵来帮助调整图结构，该方法在两个基准数据集上实现了优异的性能。

May, 2023

基于迭代图滤波网络的三维人体姿态估计

本文介绍了一种基于迭代图滤波的框架，用于3D人体姿势估计，并通过高斯-塞德尔迭代法设计了Gauss-Seidel网络架构，利用邻接修正和跳跃连接等方法改善模型性能。实验结果表明，该方法在两个标准数据集上都超过了其他基准方法，达到了最先进性能。

Jul, 2023

时空MLP图网络用于3D人体姿势估计

提出一种新的空时网络架构，通过加权雅可比特征传播规则实现了图卷积网络在3D人体姿势估计上的有效性。

Aug, 2023

基于语义图注意网络和距离信息的3D全身姿态估计

我们开发了一种新颖的语义图注意力网络，它能够从自注意力捕获全局上下文的能力中受益，同时利用图卷积来处理骨架的局部连通性和结构约束。我们还设计了一个身体部分解码器，用于提取和改进与身体特定部分相关的信息。此外，我们的方法还包含距离信息，增强了模型理解和准确预测空间关系的能力。最后，我们引入了一种几何损失，对身体的结构骨架施加了关键约束，以确保模型的预测符合人体姿势的自然限制。实验证明了我们方法的有效性，表明系统中的每个元素对提高姿势估计结果至关重要。与最先进方法相比，我们的工作不仅达到了现有基准，而且超过了现有基准。

Jun, 2024

STGFormer: 基于时空图的三维人体姿势估计视频模型

该研究提出了一种融合基于体形结构图的表示和时空信息的时空图神经网络建模框架，以解决视频中三维人体姿势估计中深度模糊所带来的挑战。通过引入融合图信息的注意力机制以及在参数使用和特征学习方面的优化处理，该方法在Human3.6M和MPI-INF-3DHP数据集上实现了领先水平的三维人体姿势估计性能。

Jul, 2024