多人三维姿态估计的压缩体积热力图
本论文介绍了作者在 2018 ECCV PoseTrack Challenge 中 3D 人体姿势估计比赛中获胜的方法,使用全卷积 Backbone 架构,增强训练数据使用来自 Pascal VOC 数据集的随机遮挡物,使用 L1 误差最小化在 3D 相机空间中反投影坐标得到绝对人中心深度的预测结果。
Sep, 2018
这项研究解决了通过多视角图像重建三维人体网格的问题,通过使用自动编码器对顶点热图进行表示学习,并利用 AMMASS 数据集学习顶点之间的连结模式,开发了一种基于先前训练好的权重的潜在代码监督的身体编码预测器来重建人体网格,并在 Human3.6M 和 LightStage 数据集上实验后发现该方法的表现超过了以前的方法,达到了最先进的人体网格重建性能。
Jun, 2023
本研究通过对 3D 人体姿态估计表征问题的认真研究,提出了一种方法,并且对现有的最优解的表现进行了超越,在标准测试基准中相对误差降低超过 30%,该方法包括 Convolutional Network、端到端的学习模型、从粗到细的预测方案和三维体表示。
Nov, 2016
本研究中,我们提出了一种度量尺度的截断鲁棒体素热力图,该热力图的维度定义在靠近主体的度量 3D 空间中,使我们能够在没有测试时间知识的情况下估计完整的度量尺度姿势,同时优于现有人体姿势估计标准,具有实时性。
Mar, 2020
本文介绍了一种改进的三维人体姿势预测模型 MargiPose,它使用深度神经网络和增强软最大值方案,可以在保持可微性的同时,从单眼 RGB 图像中预测二维边缘热图,并在公开的三维人体姿势估计数据上实现了最新的准确性。
Jun, 2018
本研究提出了一种使用 Part-Centric Heatmap Triplets 作为中间状态的方法,通过 Convolutional Network 将其从输入的图像预测出来,并在 volumetric joint-heatmap regression 之后从体积热图中提取出关节位置,从而缩小了 2D 与 3D 之间的差距,实现 3D 人体姿态估计,并在对比实验中比当前最先进的方法有明显的性能提升(Human3.6M 上提升了 20%)。
Oct, 2019
本研究提出一种名为 MEVA 的基于自动编码器的运动压缩技术,将人类运动分解为平稳运动表示和通过运动细化学习的残差表示,从而捕捉人类运动的粗略整体动作和个人特定细节。实验结果表明,该方法产生了平稳和准确的 3D 人体姿态和运动估计。
Aug, 2020
通过提出的 HG-RCNN 网络,借助 Mask-RCNN 和 Hourglass 结构进行多人 3D 人体姿态估计,实现对每个感兴趣区域(RoI)中 2D 关键点的先预测后提升,最终采用弱透视投影模型和焦距和根偏移的联合优化将估计的 3D 姿态置于相机坐标系下,该网络简单模块化且无需多人 3D 姿态数据集,取得了 MuPoTS-3D 数据集的最优性能,并能近似在相机坐标系下估计 3D 姿态。
Sep, 2019