基于网格卷积的三维人体姿态提取
本文介绍了一种基于迭代图滤波的框架,用于 3D 人体姿势估计,并通过高斯 - 塞德尔迭代法设计了 Gauss-Seidel 网络架构,利用邻接修正和跳跃连接等方法改善模型性能。实验结果表明,该方法在两个标准数据集上都超过了其他基准方法,达到了最先进性能。
Jul, 2023
通过使用全局本地自适应图卷积网络 (GLA-GCN) 并利用地面实况数据,作者针对 3D 人体姿势估计中的姿势抬升问题提出了一种简单而有效的模型设计,实验证明该设计在三个基准数据集上表现出了明显的优于现有方法的效果。
Jul, 2023
本文提出了一种新的神经网络结构 Semantic Graph Convolutional Networks(SemGCN),它能够学习在回归任务中捕捉图形结构数据中的语义信息,特别是局部和全局节点之间的关系,并将其应用于 3D 人体姿势回归,结果表明 SemGCN 仅使用 90%的参数就优于现有技术水平。
Apr, 2019
该研究提出了 Ske2Grid,这是一个用于改进基于骨骼的动作识别的新型表示学习框架。Ske2Grid 通过在人体骨骼的一种新颖的网格表示上定义规则卷积操作来构建和学习一个紧凑的图像样式的网格块,并提出了三种新的设计来保证其双射属性和增强网格表示的表达能力。经过实验证明,在六种主流基于骨骼的动作识别数据集上,Ske2Grid 明显优于现有的基于图卷积网络的解决方案,且不需添加额外的修饰。
Aug, 2023
本文提出一种基于有向图模型的 U 型结构的条件有向图卷积网络,用于从单目视频中进行 3D 人体姿势估计,实验结果表明有向图模型可以更好地利用人体骨骼的层次结构,而条件连接可以为不同的姿态产生自适应的图拓扑。
Jul, 2021
本文提出了一种基于多图卷积网络 (MGCN) 的三维人体姿势预测方法,该方法结合自然结构和序列注意力,同时捕获空间和时间信息,并在人体运动预测的基准数据集上表现出比现有方法更好的效果。
Apr, 2023
本文提出了一种基于图卷积神经网络的深度网格关系捕捉方法,结合形状完整性任务实现单张图像的 3D 人体形状重建,通过在网格节点之间的深度关系编码来解决预定义邻接矩阵的局限性,并通过形状完成任务来学习各种遮挡情况的先验知识减轻了性能退化问题。
Aug, 2021
本文提出了一种名为 Double-chain Graph Convolutional Transformer (DC-GCT) 的新模型,通过局部到全局和全局到局部的双链设计来约束姿势,并结合 GCN 和 Transformer 的优势以及基于自注意机制的局部约束模块和全局约束模块以及特征交互模块来完整捕捉人体关节之间的多级依赖关系,将时间信息引入单帧模型,并在计算成本几乎不增加的情况下通过将目标帧的关节嵌入来指导视频序列嵌入。实验结果表明,DC-GCT 在两个具有挑战性的数据集(Human3.6M 和 MPI-INF-3DHP)上达到了最先进的性能。值得注意的是,我们的模型在 Human3.6M 数据集的所有动作类别上都使用了 CPN 检测到的 2D 姿势,我们的代码可在此 URL 获取。
Aug, 2023