ElePose: 通过预测相机高度并在二维姿态上学习归一化流的无监督三维人体姿态估计
本文提出了一种自我监督的方法,利用未标注的多视角数据学习单图像三维姿态估计器,通过多视角一致性约束将观察到的二维姿态分离成基础的三维姿态和相机旋转,并且提出了新的、无偏的重建目标函数,跨视角和训练样本混合信息。该方法在两个基准数据集(Human3.6M 和 MPII-INF-3DHP)和野外 SkiPose 数据集上进行了评估。
Nov, 2020
本论文提出了一种新的自我监督方法,通过训练不带标签的典型姿势图像数据集和未成对的 2D 姿势数据,从而实现了从单幅图像预测 3D 人体姿势的网络映射,可用于快速应用于其他人工结构(例如动物)的姿态估计。
Apr, 2023
本文提出了一种基于正规化流的人体 3D 姿态恢复方法,采用多种假设生成可行的 3D 姿势的后验分布,并结合 2D 检测器的不确定性信息建模不确定探测和遮挡,其中学习出的 3D 姿态先验和最优 M 损失的推广是实现成功的关键因素,该方法在人体 3.6M 和 MPI-INF-3DHP 两个基准数据集上优于所有可比方法。
Jul, 2021
通过弱监督学习和人群注释者提供的深度相对估计信号,我们提出一种 3D 人体姿势估计算法,用于只在 2D 输入图像中学习。结果竞争力优于目前现有算法,可为在未经过精心控制的现实世界中进行 3D 姿势估计开辟道路。
May, 2018
本文提出了一种基于运动捕捉数据集和大规模图像和视频数据集的半监督和自监督学习方法,利用运动和不同 iable 的语义身体部位对齐损失函数进行训练,来精确地估计单眼三维人体姿态和形状。实验结果证明,该方法优于现有技术,可用于广泛的真实场景。
Mar, 2020
通过采用无监督学习技术,基于来自单个图像的 2D 骨架关节,我们提出了一种恢复 3D 人体姿势的方法,该方法不需要任何多视图图像数据、3D 骨架、2D-3D 点之间的对应关系或在训练过程中使用先前学习的 3D 先验知识。我们的方法采用一个 lifting 网络将 2D 关键点作为输入,并生成相应的 3D 骨架估计,其中我们通过在随机相机视点重投影修复后的 3D 骨架来产生新的 “合成” 2D 姿态。我们还训练了一个 2D 域适配器网络来扩展 2D 数据,并通过自适应正则化机制使域适应效果更好。最终,在 Human3.6M 数据集上,我们的方法对无监督三维 lifting 的改进达到了 30%,并且优于许多明确使用 3D 数据的弱监督方法。
Apr, 2019
本文提出了一种通过多视角的训练,使用一致性约束联合监督损失及惩罚项实现替代大量标注的 3D 人体姿态估计方法,并提出了一种联合估计相机姿态及人体姿态的方法,在 3D 人体姿态估计方面取得了良好的表现。
Mar, 2018
本研究提出了一种基于自主学习的 3D 人体姿态估计方法 EpipolarPose,可以不需要 3D 地面真实数据或相机外参信息,通过对多视图图像中的 2D 姿态进行估计,然后利用极线几何获得 3D 姿态和相机几何信息进行训练 3D 姿态估计,实验结果表明,在标准数据集 Human3.6M 和 MPI-INF-3DHP 上,本方法 在弱 / 自监督方法中取得了最新的最新最优成果,并提出了一种新的性能度量 Pose Structure Score (PSS) 来度量姿势相对于其地面真实性的结构合理性。
Mar, 2019
使用两种解剖启发的损失函数和弱监督学习框架,结合大规模野外 2D 和室内 / 合成 3D 数据共同学习人体姿态估计。还提出了一个简单的时间网络来调和预测的姿态序列,并通过损失表面可视化和敏感性分析仔细分析了所提出的贡献的工作机制。我们的完整流程在 Human3.6M 和 MPI-INF-3DHP 上分别提高了 11.8%和 12%,并在普通图形卡上以 30 FPS 运行。
Nov, 2017
研究人员提出了一种无监督多人二维至三维人体姿势估计方法,通过对相机高度角度进行预测,解决了单眼图像中透视模糊问题,实现了精确的人体姿势三维重建,并在 CHI3D 数据集上展示了结果和量化评估。
Sep, 2023