深度自编码器用于联合人体姿态估计和身体模型升级
本研究提出了一种几何感知的人体姿态三维表示方法,通过使用多个视角和简单的自编码器模型以 2D 关键点信息为监督,在训练阶段建立共享的 3D 表示,进而通过骨架编码器 - 解码器机制在潜在空间提取仅与姿态相关的表示。实验结果表明,该方法能够显著提高现有姿态估计方法的性能。
Mar, 2019
本研究展示了一个基于深度学习的 3D 人体姿态估计方法,为了克服不同数据集提供的不同骨骼格式这一障碍,我们提出了一种新颖的仿射组合自编码器方法 (ACAE),以实现由多个数据集超级所见,其中我们使用 28 个 3D 人体姿态数据集来监督一个模型,并在各种基准测试中取得了比以前的工作更好的表现。
Dec, 2022
本文提出了一种基于深度学习回归体系结构的 3D 人体姿势结构预测方法,该方法借助于过度完备的自动编码器并考虑关节从属关系,优于现有技术,包括结构保留和预测准确性两方面。
May, 2016
本文提出使用多视角图像而无需注释,来学习一个具有几何感知能力的身体表示,通过使用该身体表示,我们的方法在仅使用少量标记数据的情况下,显著优于完全监督的方法,并且在使用仅 1% 标记数据时,也优于其他半监督方法。
Apr, 2018
本文通过提出一种新的方法,在人体姿势估计中实现了更好的 3D 姿势估计精度,通过使用单目图像序列并利用深度全卷积网络预测 2D 关节位置的不确定性图,并使用期望最大化算法进行 3D 姿势估计。
Nov, 2015
本文提出了一种像自动编码器一样的网络架构,以学习解缠人体的形状和姿势嵌入,特别是针对三维人体。通过分层重构流程和一个大数据集的构建,并对神经网络进行学习,提高了重构准确性。通过广泛实验,我们的学习到的三维人体嵌入在各种应用中展现了强大的能力。
May, 2019
通过提出一种新颖的编码器 - 解码器 Transformer 架构,结合多视角和时间信息、几何关系和 2D 姿态检测可信度,我们解决了估计多视图下遮挡和受限重叠视图的 3D 人体姿势的挑战。我们的实验表明该方法在传统三角定位方法的具有挑战性的遮挡场景和视图受限场景中表现出很好的效果。
Dec, 2023
本文提出了一个异构多任务学习框架,用于通过深度卷积神经网络从单 ocular 图像中实现人体姿势估计,同时学习姿势 - 关节回归器和滑动窗口身体部位检测器,并证明包含身体部位检测任务有助于正则化网络,并指导其收敛于良好解决方案,并在多个数据集上报告了竞争和最先进的结果。 还通过实验证明,我们的网络中间层中学习的神经元针对局部身体部位进行了优化。
Jun, 2014
本文提出了一种基于 Transformer 的姿势提升方案,能够处理时间上稀疏的二维姿势序列,但仍能产生时间上密集的三维姿势估计。其采用掩码令牌建模来实现 Transformer 块内的时间上采样,可以大大降低总计算复杂度。在 Human3.6M 和 MPI-INF-3DHP 上评估表明,相对于现有的方法,所提出的方法在保持准确性的同时将推理时间降低了 12 倍,这提高了在不同应用中使用可变消费者硬件的实时吞吐量。
Oct, 2022