基于网格卷积的三维人体姿态提取

AAAIFeb, 2023

基于网格卷积的三维人体姿态提取

3D Human Pose Lifting with Grid Convolution

Yangyuxuan Kang, Yuyang Liu, Anbang Yao, Shandong Wang, Enhua Wu

TL;DR本文提出了一种基于网格卷积的新的姿态估计模型，通过 Semantic Grid Transformation 将不规则的图结构人体姿态映射到网格状姿态表示，利用注意力机制和卷积核实现空间感知和网格特异卷积算子，取得了 Human3.6M 和 MPI-INF-3DHP 等数据上优异的效果。

Abstract

Existing lifting networks for regressing 3D human poses from 2D single-view poses are typically constructed with linear layers based on graph-structured representation learning. In sharp contrast to them, this paper presents Grid Convolution (GridConv), mimicking the wisdom of regular convolution operations in image space. GridConv is based on a novel

grid convolution semantic grid transformation lifting representation learning attention module convolutional kernel

发现论文，激发创造

基于迭代图滤波网络的三维人体姿态估计

本文介绍了一种基于迭代图滤波的框架，用于 3D 人体姿势估计，并通过高斯 - 塞德尔迭代法设计了 Gauss-Seidel 网络架构，利用邻接修正和跳跃连接等方法改善模型性能。实验结果表明，该方法在两个标准数据集上都超过了其他基准方法，达到了最先进性能。

Jul, 2023

全局 - 局部自适应图卷积网络用于 3D 人体

通过使用全局本地自适应图卷积网络 (GLA-GCN) 并利用地面实况数据，作者针对 3D 人体姿势估计中的姿势抬升问题提出了一种简单而有效的模型设计，实验证明该设计在三个基准数据集上表现出了明显的优于现有方法的效果。

Jul, 2023

用于 3D 人体姿势回归的语义图卷积网络

本文提出了一种新的神经网络结构 Semantic Graph Convolutional Networks（SemGCN），它能够学习在回归任务中捕捉图形结构数据中的语义信息，特别是局部和全局节点之间的关系，并将其应用于 3D 人体姿势回归，结果表明 SemGCN 仅使用 90％的参数就优于现有技术水平。

Apr, 2019

Ske2Grid: 面向动作识别的骨架到网格表示学习

该研究提出了 Ske2Grid，这是一个用于改进基于骨骼的动作识别的新型表示学习框架。Ske2Grid 通过在人体骨骼的一种新颖的网格表示上定义规则卷积操作来构建和学习一个紧凑的图像样式的网格块，并提出了三种新的设计来保证其双射属性和增强网格表示的表达能力。经过实验证明，在六种主流基于骨骼的动作识别数据集上，Ske2Grid 明显优于现有的基于图卷积网络的解决方案，且不需添加额外的修饰。

Aug, 2023

条件有向图卷积用于三维人体姿态估计

本文提出一种基于有向图模型的 U 型结构的条件有向图卷积网络，用于从单目视频中进行 3D 人体姿势估计，实验结果表明有向图模型可以更好地利用人体骨骼的层次结构，而条件连接可以为不同的姿态产生自适应的图拓扑。

Jul, 2021

多图卷积网络用于姿态预测

本文提出了一种基于多图卷积网络 (MGCN) 的三维人体姿势预测方法，该方法结合自然结构和序列注意力，同时捕获空间和时间信息，并在人体运动预测的基准数据集上表现出比现有方法更好的效果。

Apr, 2023

卷积网络和图形模型联合训练的人体姿态估计

本文提出一种新的混合架构，并将其成功应用于单眼图像中的人体姿态估计等领域，同时提出了联合训练的想法以提高性能并明显超越现有技术。

Jun, 2014

DC-GNet：用于 3D 人体形状重建的深度网格关系捕获图卷积网络

本文提出了一种基于图卷积神经网络的深度网格关系捕捉方法，结合形状完整性任务实现单张图像的 3D 人体形状重建，通过在网格节点之间的深度关系编码来解决预定义邻接矩阵的局限性，并通过形状完成任务来学习各种遮挡情况的先验知识减轻了性能退化问题。

Aug, 2021

图像和视频的三维人体姿态估计的双链约束

本文提出了一种名为 Double-chain Graph Convolutional Transformer (DC-GCT) 的新模型，通过局部到全局和全局到局部的双链设计来约束姿势，并结合 GCN 和 Transformer 的优势以及基于自注意机制的局部约束模块和全局约束模块以及特征交互模块来完整捕捉人体关节之间的多级依赖关系，将时间信息引入单帧模型，并在计算成本几乎不增加的情况下通过将目标帧的关节嵌入来指导视频序列嵌入。实验结果表明，DC-GCT 在两个具有挑战性的数据集（Human3.6M 和 MPI-INF-3DHP）上达到了最先进的性能。值得注意的是，我们的模型在 Human3.6M 数据集的所有动作类别上都使用了 CPN 检测到的 2D 姿势，我们的代码可在此 URL 获取。

Aug, 2023

异构网格卷积：适应性、高效性和可控计算

通过生成一种数据自适应的图形结构并利用方向感知图形卷积，本文提出了一种新型的异构网络卷积模型，并在四个图像理解任务上进行了评估。

Apr, 2021