立体相机端到端的 3D 手部姿态估计

Jun, 2022

立体相机端到端的 3D 手部姿态估计

End-to-End 3D Hand Pose Estimation from Stereo Cameras

Yuncheng Li, Zehao Xue, Yingying Wang, Liuhao Ge, Zhou Ren...

TL;DR该研究提出了一种使用端到端方法从立体相机中估计完整的三维手势姿态的方法，通过神经网络架构的扩展，该方法能够更好地实现稀疏视差手关节的估计，并且提出了一种大规模的合成数据集来有效训练模型。

Abstract

This work proposes an end-to-end approach to estimate full 3D hand pose from stereo cameras. Most existing methods of estimating hand pose from stereo cameras apply stereo matching to obtain depth map and use depth-based solution to estimate hand pose. In contrast, we propose to bypass

3d hand pose estimation stereo cameras neural network architecture synthetic dataset sparse disparity

发现论文，激发创造

Hand3D：使用 3D 神经网络进行手部姿态估计

使用新的 3D 神经网络架构，通过深度图到三维体积表示的转化，直接对手的三维姿态进行估计，无需进一步处理。同时通过合成深度图来增加训练数据覆盖率，在公开数据上达到了最优性能。

Apr, 2017

DeepHPS: 基于合成深度学习的端到端三维手部姿态和形状估计

通过使用卷积神经网络结构，从单个深度图像中学习手部姿势，骨骼比例和复杂形状参数，以及使用一个新的手部姿势和形状层来产生 3D 关节位置和手部网格，利用 SynHand5M 数据集，在综合数据集上展示了良好的效果。

Aug, 2018

使用立体匹配技术进行三维手部姿态跟踪与估计

本论文提出使用被动立体视觉技术跟踪 / 估计手部姿势的手部姿势跟踪 / 估计算法，并提出 18,000 对立体图像和 18,000 对深度图像的基准数据，以及手掌和手指关节的地面真实 3D 位置，以测试该算法在不同挑战场景下的表现，并且通过手部分割算法提高了跟踪 / 估计算法的性能并得到了量化验证，结果表明被动立体视觉技术具有与主动深度传感器类似的跟踪质量。

Oct, 2016

从单张 RGB 图像学习估计 3D 手部姿势

本文提出了一种通过 RGB 图像估计 3D 手部姿势的方法，使用深度学习和关键点检测方法，配合学习的 3D 关节先验，以及基于合成手模型的大规模数据集进行了实验验证。

May, 2017

手势姿势估计的密集三维回归

该研究提出了一种基于单个深度帧的三维手部姿态估计方法，通过像素级别的估计实现高效准确地实现骨架姿态估计，并在 MSRA 和 NYU 手部数据集上，其方法实现了最好的性能。

Nov, 2017

基于单深度图像的稳健三维手部姿势估计：从单视角 CNN 到多视角 CNN

该论文提出了一种新方法，利用多视角投影和学习的姿态先验，通过多视角热图来回归手部姿态，最终得出三维手势估计，实验表明该方法在难以应对的数据集上取得了优异表现。

Jun, 2016

从单一 RGB 图像中估计 3D 手型和姿势

本文提出了一种基于图形卷积神经网络的方法，从单个 RGB 图像中估算手的 3D 形状和姿态，并通过含 3D 地面真值的大规模合成数据集和深度图弱监督学习进行训练，结果表明可以对手的 3D 网格进行准确和合理的重建，并在与现有最先进方法的比较中达到了更高的 3D 姿态估计准确性。

Mar, 2019

使用单目 RGB 进行双手全局 3D 姿态估计

本文提出了一种基于卷积神经网络的多阶段流水线方法，仅通过单眼红绿蓝彩色图像在众多的干扰因素下，准确分割和定位手部区域并估计 2D 和 3D 的关节点位置；采用新颖的投影算法计算相对相机坐标系的全局关节点位置，为此引入大规模合成 3D 手部姿态数据集。在 RGB-only 信息下，本文超越了以往的 3D 典型手部姿态估计基准数据集；此外，本文提供了 RGB-only 输入下首个实现双手的准确全局 3D 手部跟踪，并进行了广泛的定量和定性评估。

Jun, 2020

深入学习手势姿态估计

本文研究使用卷积神经网络结构，预测手的三维关节位置，并通过引入关节先验和有效利用上下文来提高方案的预测精确性和可靠性，在多个基准测试中都表现出了远胜于现有技术的高精度和较快的计算时间。

Feb, 2015

高效创建三维训练数据以进行手部姿态细化估计

本文提出了一种半自动标记方法，该方法可以高效地标记手深度视频的每一帧，从而获得 3D 关节位置数据用于训练手势估计模型，并在手势识别领域取得了最先进的精度。

May, 2016