- 带扰动位置编码的三维人体姿势估计中的遮挡处理
利用 PerturbPE 方法,从 eigenbasis 中提取一致且规则的组件来增强模型的鲁棒性和普适性,实验结果在 Human3.6M 数据集上表现出高达 12% 的性能提升,并在缺失两条边的情况下显著改善了性能,创造了新的最先进水平。
- CasCalib:基于级联校准的来自稀疏非同步相机的动作捕捉
使用离线的 3D 姿势估计器,结合多视图线索和相机校准,自动化地获取 3D 人体姿态信息,包括时间同步和相机内外部校准,并通过将高维时间和校准空间划分为级联子空间以及引入定制算法来优化每个子空间,最终实现了易于使用、灵活且稳健的动作捕捉工具 - CVPRFinePOSE: 经控制的高精度 3D 人体姿势估计
3D 人体姿势估计任务使用 2D 图像或视频预测 3D 空间中的人体关节坐标。本论文提出了一种基于扩散模型的 Fine-Grained Prompt-Driven Denoiser(FinePOSE)用于 3D 人体姿势估计,通过构建细粒度 - 多跳图变换网络用于 3D 人体姿势估计
介绍了一个用于视频中 2D 到 3D 人体姿势估计的多跳图变换网络,通过利用多头自注意力和多跳图卷积网络的优势以捕获时空依赖关系和处理远距离交互,提出了一个模型架构来实现准确的全局和局部依赖关系捕捉以及处理所需的空间细节,实验结果表明其有效 - 适应性噪声采样概率恢复的三维人体姿势估计
基于弱监督方法,提出了适用于轻量级单假设模型的概率恢复三维人体姿势评估框架(PRPose),通过逆向映射隐藏概率分布,采用自适应噪声采样策略生成合理的多假设样本,从而解决了 2D 姿势检测误差和 2D 到 3D 非正常问题的限制,实验证明了 - 深度强化学习中的机械臂控制和抓取行为模仿
本研究提出了一种采用 3D 人体姿态估计和强化学习相结合的新型运动模仿模型,通过将运动模仿转化为强化学习中的关节角度预测问题,从而极大减少了对大量训练数据的依赖,使得模型能够从仅有几秒钟的视频中学习模仿策略,并展现出强大的泛化能力。该项目可 - Quater-GCN: 用方向和半监督训练提升 3D 人体姿势估计
通过结合方向性信息,引入 Quater-GCN (Q-GCN) 方法来提高 3D 人体姿势估计性能,并通过半监督训练策略利用无标签数据解决有限方向性的挑战。Q-GCN 在与现有方法的综合评估中展现出优秀的性能。
- CVPR带遮挡的 3D 人体姿态估计:介绍 BlendMimic3D 数据集和 GCN 优化
在 3D 人体姿势估计领域中,准确估计人体姿势,特别是在存在遮挡的情况下,是一个重要挑战。本研究通过填补当前 3D 人体姿势估计技术的不足之处,即缺乏处理遮挡数据和策略,引入了新颖的 BlendMimic3D 数据集,设计用于模拟真实世界中 - CVPRKTPFormer: 基于运动学和轨迹先验知识增强的 3D 人体姿态估计 Transformer
本文提出了一种新颖的运动学和轨迹先验增强 Transformer(KTPFormer),它克服了现有基于 Transformer 的 3D 人体姿势估计方法的弱点,即其自注意机制中的 Q、K、V 向量的导出都基于简单的线性映射。我们提出了两 - 3D 视角下人体姿态估计的调研
本综述论文旨在提供关于自中心姿势估计研究的全面概述,包括流行数据集、不同姿势估计模型的分类和讨论,通过对比分析突出不同方法的优缺点。此综述能为研究人员和实践者提供宝贵资源,洞察自中心姿势估计的关键概念、前沿解决方案,以及未来研究领域的待解问 - CVPR三维人体姿态估计中的领域泛化的双增强框架
我们提出了一种新的框架,使用两个姿势增强器,以应对 3D 人体姿势估计领域普遍化中的若干限制,并通过元优化模拟领域移位,从而显著提高姿势估计器的普适能力。
- AAAI基于分离的扩散法进行层次空间和时间去噪的 3D 人体姿势估计
提出了一种具有层次空间和时间降噪器的解开扩散式的三维人体姿势估计方法,该方法通过在扩散模型的正向过程中解开姿势并扩散骨长和骨方向,以有效建模人体姿势先验。在反向过程中,通过使用层次相关的空间转换器和层次相关的时间转换器来改进每个关节的层次建 - 深度学习用于 3D 人体姿势估计和网格恢复的综述
本文通过研究 200 多篇论文,全面回顾了过去五年中 3D 人体姿态估计和网格恢复领域的深度学习方法进展,包括单人和多人方法,以及基于显式模型和隐式表示的人体网格恢复方法,并提供了公开数据集上的比较结果,以及深入观察和激发未来研究方向。
- 三维人体姿势估计的不确定性感知测试时间优化
我们提出了一种基于不确定性的测试时间优化(UAO)框架,该框架在培训期间设计了一个有效的 2D 到 3D 网络来估计相应的 3D 姿势,同时量化每个 3D 关节的不确定性,通过优化的潜在状态来减轻过度拟合问题,并使用投影损失确保在 2D 空 - 多透视 空时关系变换的精确 3D 人体姿势估计
我们提出了一个多阶段的 3D 序列到序列人体姿势检测框架,利用变压器的自注意力机制从多视角视频数据中捕捉空间 - 时间相关性,实验结果表明我们的方法在 Human3.6M 数据集上表现出色。
- 多视角非标定深度相机下的多人三维姿态估计
利用稀疏的未校准深度相机提供的 RGBD 视频流,我们提出了一种简单的多视角深度人体姿态估计 (MVD-HPE) 管线,用于联合预测相机姿态和 3D 人体姿态,无需训练深度 3D 人体姿态回归模型。
- 基于扩散的姿态优化与多假设生成的三维人体姿态估计
我们提出了一种基于扩散的优化框架 DRPose 来改进确定性模型的性能,并借助多噪声的多步骤优化和多假设预测,实现了适用于当前姿势基准的更合适的多假设预测。
- D3PRefiner:一种基于扩散的 3D 人体姿势优化方法
使用单眼相机进行三维人体姿态估计存在深度模糊问题,本文提出了一种基于扩散的三维姿态优化器 (D3PRefiner),通过神经网络学习噪声姿态和真实姿态之间的映射关系,从而大幅提高当前的三维姿态估计性能。
- 从主观立体视频中感知 3D 人体姿势
通过使用新的基于 transformer 模型的框架,结合场景信息和长时空上下文,利用头戴设备提供的俯视图来更准确地估计包括蹲下和坐下等复杂动作的三维人体姿态,并提出了两个新的用于综合评估现有和即将推出方法的数据集 UnrealEgo2 和 - AAAI基于图像的抬举 —— 利用图像线索进行精确的三维人体姿势估计
深度学习技术用于估计人体姿势时,由于仅凭借 2D 姿势估计存在深度模糊问题,这篇论文提出了一种新的框架,通过利用图像特征和逐步学习的方法解决了泛化能力差的问题,并在多个数据集上取得了最先进的性能。