学习姿态语法以编码人体构型,用于三维姿态估计
使用两种解剖启发的损失函数和弱监督学习框架,结合大规模野外 2D 和室内 / 合成 3D 数据共同学习人体姿态估计。还提出了一个简单的时间网络来调和预测的姿态序列,并通过损失表面可视化和敏感性分析仔细分析了所提出的贡献的工作机制。我们的完整流程在 Human3.6M 和 MPI-INF-3DHP 上分别提高了 11.8%和 12%,并在普通图形卡上以 30 FPS 运行。
Nov, 2017
本文提出了一种基于深度学习回归体系结构的 3D 人体姿势结构预测方法,该方法借助于过度完备的自动编码器并考虑关节从属关系,优于现有技术,包括结构保留和预测准确性两方面。
May, 2016
本研究提出了一种几何感知的人体姿态三维表示方法,通过使用多个视角和简单的自编码器模型以 2D 关键点信息为监督,在训练阶段建立共享的 3D 表示,进而通过骨架编码器 - 解码器机制在潜在空间提取仅与姿态相关的表示。实验结果表明,该方法能够显著提高现有姿态估计方法的性能。
Mar, 2019
提出使用神经网络框架 PoseNet3D 将二维关节作为输入,输出三维骨架和 SMPL 体模型参数,通过在学生 - 教师框架下的学习方法,无需使用任何 3D 数据进行训练,结果表明与之前的无监督方法相比,该方法将 3D 关节预测误差降低了 18%。
Mar, 2020
提出了一种新的基于增强学习的姿势预测模型,结合行为克隆和生成对抗学习,通过这种模型对未来的人体姿势进行预测,实验结果表明该模型在短期和长期预测方面优于现有方法。
Sep, 2019
本研究提出了一种新的骨骼 GNN 学习解决方案,包括基于跳舞的分层通道压缩融合层和鲁棒且有效的图构建过程,该方法在人体姿态估计和基于骨骼的动作识别方面取得了超越同行的性能.
Aug, 2021
本文提出了一种新颖的 ConvNet 模型,可预测图像中的 2D 人体姿势,通过回归每个关键点的热度图表示,并能够学习和表示部件外观和配置上下文。模型可以从头开始和端到端训练,用于改善性能的辅助损失。该模型在两个基准数据集上进行了评估,具有与最先进技术相当的性能,但不含有图形模型阶段(或层)的复杂性。
May, 2016
PoseGPT 是一个框架,利用大型语言模型(LLMs)从图像或文本描述中理解和推理出 3D 人体姿势。它通过嵌入 SMPL 姿势作为多模态 LLM 中的独立信号标记来解决传统人体姿势估计方法的局限性,不仅简化了姿势预测,而且赋予了 LLMs 在推理人体姿势方面应用它们的世界知识的能力,从而在姿势估计上进行推理,创造了两项先进任务:姿势的假设生成和姿势估计的推理。PoseGPT 在这些新提出的任务上优于现有的多模态 LLMs 和特定任务的方法,并开辟了人体姿势分析的新方向。
Nov, 2023
该研究利用深度学习在单目 3D 人体姿势估计领域提出了一种新型结构,可以同时从图像中推算出 3D 关节坐标和 2D 关节位置,使用可训练的融合方案使信息得以最佳融合,从而在标准的 3D 人体姿势估计基准测试中大幅提高了现有技术水平。
Nov, 2016
本文提出一种基于深度神经网络的人体姿势估计方法,将姿势估计表示为一种基于 DNN 的回归问题,通过级联 DNN 回归器来提高姿势估计的精确性,并在四种不同类型的学术基准测试中取得了优异的实验结果。
Dec, 2013