多人三维姿态估计的压缩体积热力图

CVPRApr, 2020

多人三维姿态估计的压缩体积热力图

Compressed Volumetric Heatmaps for Multi-Person 3D Pose Estimation

Matteo Fabbri, Fabio Lanzi, Simone Calderara, Stefano Alletto, Rita Cucchiara

TL;DR本文提出了一种基于多层热力图压缩的深度学习模型，可在 8 fps 的运行时处理全高清 RGB 图像，用于多人和单人 3D 人体姿态估计。

Abstract

In this paper we present a novel approach for bottom-up multi-person 3D human pose estimation from monocular RGB images. We propose to use high resolution volumetric heatmaps to model joint locations, devising a simple and effective →

multi-person 3d human pose estimation volumetric heatmaps autoencoder compression deep learning

发现论文，激发创造

基于体素热力图的合成遮挡增强技术应用于 2018 ECCV PoseTrack 3D 人体姿态估计挑战赛

本论文介绍了作者在 2018 ECCV PoseTrack Challenge 中 3D 人体姿势估计比赛中获胜的方法，使用全卷积 Backbone 架构，增强训练数据使用来自 Pascal VOC 数据集的随机遮挡物，使用 L1 误差最小化在 3D 相机空间中反投影坐标得到绝对人中心深度的预测结果。

Sep, 2018

多视角图像下基于顶点热图的 3D 人体网格重建的表示学习

这项研究解决了通过多视角图像重建三维人体网格的问题，通过使用自动编码器对顶点热图进行表示学习，并利用 AMMASS 数据集学习顶点之间的连结模式，开发了一种基于先前训练好的权重的潜在代码监督的身体编码预测器来重建人体网格，并在 Human3.6M 和 LightStage 数据集上实验后发现该方法的表现超过了以前的方法，达到了最先进的人体网格重建性能。

Jun, 2023

单视图粗细层次三维人体姿态预测

本研究通过对 3D 人体姿态估计表征问题的认真研究，提出了一种方法，并且对现有的最优解的表现进行了超越，在标准测试基准中相对误差降低超过 30％，该方法包括 Convolutional Network、端到端的学习模型、从粗到细的预测方案和三维体表示。

Nov, 2016

深度自编码器用于联合人体姿态估计和身体模型升级

采用对称卷积自动编码器训练并学习人体三维姿态和身体形状，结合高级的远距离相机视角，能够实时进行人体行为监测并准确估计人体姿态和形状。

Jul, 2018

用于三维人体姿势估计的度量尺度截断鲁棒热图

本研究中，我们提出了一种度量尺度的截断鲁棒体素热力图，该热力图的维度定义在靠近主体的度量 3D 空间中，使我们能够在没有测试时间知识的情况下估计完整的度量尺度姿势，同时优于现有人体姿势估计标准，具有实时性。

Mar, 2020

使用 2D 边缘热图进行 3D 人体姿态估计

本文介绍了一种改进的三维人体姿势预测模型 MargiPose，它使用深度神经网络和增强软最大值方案，可以在保持可微性的同时，从单眼 RGB 图像中预测二维边缘热图，并在公开的三维人体姿势估计数据上实现了最新的准确性。

Jun, 2018

三维人体姿态估计的整体平面预测到局部体积预测

该论文提出了一种使用深度图进行 3D 人体姿态估计的新方法，并运用平面网络和体积网络等模型，显著提高了模型的准确性和计算效率。

Jun, 2017

HEMlets 姿态：学习基于部件中心的热图三元组，以实现准确的三维人体姿态估计

本研究提出了一种使用 Part-Centric Heatmap Triplets 作为中间状态的方法，通过 Convolutional Network 将其从输入的图像预测出来，并在 volumetric joint-heatmap regression 之后从体积热图中提取出关节位置，从而缩小了 2D 与 3D 之间的差距，实现 3D 人体姿态估计，并在对比实验中比当前最先进的方法有明显的性能提升（Human3.6M 上提升了 20%）。

Oct, 2019

通过动作压缩和细化实现 3D 人体运动估计

本研究提出一种名为 MEVA 的基于自动编码器的运动压缩技术，将人类运动分解为平稳运动表示和通过运动细化学习的残差表示，从而捕捉人类运动的粗略整体动作和个人特定细节。实验结果表明，该方法产生了平稳和准确的 3D 人体姿态和运动估计。

Aug, 2020

从单目图像估计多人三维人体姿态

通过提出的 HG-RCNN 网络，借助 Mask-RCNN 和 Hourglass 结构进行多人 3D 人体姿态估计，实现对每个感兴趣区域（RoI）中 2D 关键点的先预测后提升，最终采用弱透视投影模型和焦距和根偏移的联合优化将估计的 3D 姿态置于相机坐标系下，该网络简单模块化且无需多人 3D 姿态数据集，取得了 MuPoTS-3D 数据集的最优性能，并能近似在相机坐标系下估计 3D 姿态。

Sep, 2019