自学习的规范空间用于多视角三维人体姿态估计

Mar, 2024

自学习的规范空间用于多视角三维人体姿态估计

Self-learning Canonical Space for Multi-view 3D Human Pose Estimation

Xiaoben Li, Mancheng Meng, Ziyan Wu, Terrence Chen, Fan Yang...

TL;DR提出了一种名为 CMANet 的全自我监督框架，利用多视角信息来预测准确的多视角 3D 人体姿势，通过聚合视角内和视角间信息，构建一个规范化参数空间

Abstract

multi-view 3d human pose estimation is naturally superior to single view one, benefiting from more comprehensive information provided by images of multiple views. The information includes camera poses, 2D/3D human poses, and 3D geometry. However, the accurate annotation of these inform

multi-view 3d human pose estimation self-supervised framework intra-view information inter-view information cascaded multi-view aggregating network

发现论文，激发创造

3D 人体姿势估计的多视图一致半监督学习

该论文提出了一种基于多视角视频的多视角一致半监督学习框架，利用未经注释、未校准但同步的多视角视频中的姿态信息相似性作为额外的弱监督信号来引导 3D 人体姿势回归，该方法通过硬负采样来建立多视角一致的姿态嵌入，并结合有限的 3D 姿态注释来完善该模型，从而在两种公开数据集上实现了视角不变的姿态检索。

Aug, 2019

从多视角图像学习单目三维人体姿态估计

本文提出了一种通过多视角的训练，使用一致性约束联合监督损失及惩罚项实现替代大量标注的 3D 人体姿态估计方法，并提出了一种联合估计相机姿态及人体姿态的方法，在 3D 人体姿态估计方面取得了良好的表现。

Mar, 2018

多视角图像中的多人姿态估计与形状感知

本文提出了一种基于多视图图像的多人姿态估计方法，在统计参数体模型的引导下，这种方法能够更好地纠正不合理的 3D 姿态估计和填充缺失的关节点检测，将 2D 和 3D 观测联系起来，从而更准确地估计 3D 姿态并且具有较好的泛化性能，实验表明该方法的效果优于现有的方法。

Oct, 2021

实现视角不变的三维人体姿势估计

提出了一种视角不变的模型，用于从单个深度图像中估计 3D 人体姿态，该模型从一个学习的视角不变特征空间中嵌入局部区域来实现，并采用自下而上的误差反馈机制进行姿态估计，多任务的学习方法可以在噪声和遮挡的情况下选择性地预测局部姿态。通过对一个先前发布的深度数据集和一个包含 10 万个注释深度图像的新收集的人体姿态数据集的评估，实验证明该模型在正面视图上实现了竞争性性能，在替代视角上实现了最先进的性能。

Mar, 2016

利用多视角图像进行形状感知人体姿态和形状重建

使用多视角图像建议一种可伸缩的神经网络框架来重建 SMPL 模型子空间中的人体 3D 网格，并在现实图像上表现优异，特别是在形状估计方面。

Aug, 2019

双视图胜过单视图：多视一致性下的单目三维姿态估计

通过使用多视角数据对单目人体姿态估计模型进行微调，引入新的一致性损失函数，提升性能，从而实现对特定应用定制模型的实用和经济有效解决方案。

Nov, 2023

基于图像的多视角 3D 多人姿态估计

本文介绍了一种从多个校准相机视角估计多个人的 3D 姿势的方法，通过使用图神经网络以及特定任务的模块实现了高性能、低计算复杂度的结果。

Sep, 2021

从单幅图像中综合估计三维人体和场景网格

本文提出了一种端到端可训练模型，以单个 RGB 图像感知 3D 场景，估计相机姿态和室内布局，并重建人体和物体网格。通过对所有估计方面施加全面而复杂的损失，我们证明了我们的模型优于现有的人体网格方法和室内场景重建方法。据我们所知，这是第一个在网格级别输出对象和人体预测，并对场景和人体姿态进行联合优化的模型。

Dec, 2020

多视角采集无标记 3D 人体姿态注释

本文提出了一种基于几何驱动的方法来自动收集人体姿势预测任务的准确的三维人体姿势标注，利用多视角设置、相机设置的 3D 几何和人体身体结构的约束，将每个视图的 2D ConvNet 预测概率组合成全局最优 3D 姿态。

Apr, 2017

SelfPose3d：自监督的多人多视角 3D 姿势估计

自我监督方法通过多视角输入图像和伪造姿势进行 3D 姿势估计，不需要 2D 或 3D 真实姿势标签，并且其有效性与完全监督方法相当。

Apr, 2024