面向高效人体网格估计的 MoCap 到视觉领域自适应从 2D 关键点

CVPRApr, 2024

面向高效人体网格估计的 MoCap 到视觉领域自适应从 2D 关键点

MoCap-to-Visual Domain Adaptation for Efficient Human Mesh Estimation from 2D Keypoints

Bedirhan Uguz, Ozhan Suat, Batuhan Karagoz, Emre Akbas

TL;DR提出了一个名为 Key2Mesh 的模型，使用 2D 人体姿势关键点作为输入并估计相应的身体网格。利用大规模的运动捕捉数据集对模型进行训练，克服了缺乏带有 3D 标签的图像数据集的问题。通过在 RGB 图像上应用对抗性领域自适应方法，提高了模型在 RGB 图像上的性能，无需昂贵的标签。在 H3.6M 和 3DPW 数据集上的结果表明，Key2Mesh 在 PA-MPJPE 方面超过其他模型，也在 MPJPE 和 PVE 方面超过了 3DPW 数据集中的其他模型。

Abstract

This paper presents key2mesh, a model that takes a set of 2D human pose keypoints as input and estimates the corresponding body mesh. Since this process does not involve any visual (i.e. RGB image) data, the mode

key2mesh human pose keypoints body mesh adversarial domain adaptation state-of-the-art

发现论文，激发创造

三维人体姿态估计 = 二维姿态估计 + 匹配

本文探讨了通过 2D 姿态估计和 3D 运动捕捉数据简单推理得出三维人体姿态的方法，并演示了该方法优于目前大部分直接由 2D 测量回归三维姿态估计系统的现有方法。

Dec, 2016

从虚拟标记估计 3D 人体网格

本文提出了基于虚拟标记的中间表示方法，通过学习 64 个身体表面关键点来重构逼真的 3D 网格，精度高于现有方法。

Mar, 2023

从视频中估计 3D 人体姿态和网格的共同演化

提出了一种 Pose and Mesh Co-Evolution 网络（PMCE），通过将任务分解为视频中基于 3D 人体姿势估计和来自估计的 3D 姿势和时间图像特征的网格顶点回归，解决了从视频中准确、平滑地恢复 3D 人体运动的问题。实验证明，该方法在三个基准数据集（3DPW、Human3.6M 和 MPI-INF-3DHP）上在逐帧准确度和时间一致性方面优于先前的最先进方法。

Aug, 2023

关键点辅助的弱监督三维姿势迁移

三维姿势转换的主要挑战是：1）没有不同角色执行相同姿势的配对训练数据；2）从目标网格中分离姿势和形状信息；3）难以应用于具有不同拓扑结构的网格。因此，我们提出了一种新颖的弱监督基于关键点的框架以克服这些困难。具体而言，我们使用一种与拓扑无关的关键点检测器和逆向运动学来计算源网格与目标网格之间的变换。我们的方法只需要对关键点进行监督，可以应用于具有不同拓扑结构的网格，并且对于目标来说是形状不变的，可以从目标网格中提取仅限于姿势的信息而不传递形状信息。我们进一步设计了一个循环重建来执行自监督姿势转换，而不需要具有与目标和源相同姿势和形状的地面实况变形网格。我们在基准人类和动物数据集上评估了我们的方法，在那里与最先进的无监督方法相比达到了卓越的性能，甚至与完全监督的方法相比具有可比性的性能。我们在更具挑战性的 Mixamo 数据集上进行测试，以验证我们的方法处理具有不同拓扑结构和复杂服装能力。跨数据集评估进一步展示了我们方法的强大泛化能力。

Jul, 2023

Pose2Mesh: 从二维人体姿势恢复三维人体姿势和网格的图卷积网络

使用图卷积神经网络的三维人体姿态估计方法 Pose2Mesh 直接从二维人体姿势估计三维网格顶点坐标，避免出现影响训练数据的外部环境的干扰，并且在多个基准数据集上优于以往的方法。

Aug, 2020

KeyPose：透明物体多视图三维标注与关键点估计

该论文提出了一种基于双目视觉输入的深度神经网络，称为 KeyPose，并使用该网络从 RGB 相机标记的三维关键点预测物体姿势，即使在透明物体的情况下也能取得比现有方法更好的 3D 姿态估计表现。

Dec, 2019

KAMA：三维关键点感知身体网格骨架

KAMA 是一种 3D Keypoint Aware Mesh Articulation 方法，能够通过 3D 身体关键点的位置估计出人体网格，该方法不需要任何匹配的网格注释，能够通过纯粹的 3D 关键点回归实现最先进的网格拟合。

Apr, 2021

使用多视角关键点对应估计单目图像中的物体姿态

利用物体分类内部几何规律的数据驱动姿态估计方法。首先，从 2D RGB 图像学习物体部分的姿态不变局部描述符。将这些描述符与来自固定３D 模板的关键点结合使用，生成给定单眼实际图像的关键点对应图。最后，使用这些关键点对应图，预测物体的３D 姿态。该方法在多个真实环境的视角估计数据集，如 Pascal3D + 与 ObjectNet3D 上的表现达到最佳水平，并且我们公开了所使用方法的代码以鼓励再生研究。

Sep, 2018

2D3D-MatchNet：学习在 2D 图像和 3D 点云之间匹配关键点

本研究提出了一种名为 2D3D-MatchNet 的深度网络结构，能够直接从图像和点云中的 2D 和 3D 关键点描述符中匹配和建立 2D-3D 对应关系，并用于视觉位姿估计，结果表明该方法是可行的。

Apr, 2019

用于从 2D 人体姿态估计中获得人体姿态和形状的模块化多阶段轻量级图转换网络

本文提出了一种基于图表的变形网络，实现了从二维人体姿态到三维人体姿态的估计和到三维人体网格参数的回归。该方法在保证精度的同时，优化了计算效率，具有广泛的实际应用价值。

Jan, 2023