Karim Iskakov, Egor Burkov, Victor Lempitsky, Yury Malkov
TL;DR基于可学习的三角测量方法,使用两种新颖方案对多视图 3D 人体姿势估计进行了探索,其中一种使用置信度权重,另一种是基于体积聚合和三维卷积技术,具有端到端可微的特性,提高了 Human3.6M 数据集上的多视图姿态估计表现。
Abstract
We present two novel solutions for multi-view 3d human pose estimation based
on new learnable triangulation methods that combine 3D information from
multiple 2D views. The first (baseline) solution is a basic dif
提出了一种视角不变的模型,用于从单个深度图像中估计 3D 人体姿态,该模型从一个学习的视角不变特征空间中嵌入局部区域来实现,并采用自下而上的误差反馈机制进行姿态估计,多任务的学习方法可以在噪声和遮挡的情况下选择性地预测局部姿态。通过对一个先前发布的深度数据集和一个包含 10 万个注释深度图像的新收集的人体姿态数据集的评估,实验证明该模型在正面视图上实现了竞争性性能,在替代视角上实现了最先进的性能。