- MEGA:人体网格恢复的掩码生成自编码器
基于掩码生成建模的新方法 MEGA,可以从图像和部分人体网格序列中恢复人体网格,通过灵活的生成方案可以在确定模式下预测单个人体网格或在随机模式下生成多个人体网格,实验结果表明 MEGA 在确定和随机模式下均取得了最先进的性能,优于单输出和多 - 使用动态事件相机进行 3D 人体扫描
本文提出了一种新的基于事件的方法,用于 3D 姿态估计和人体网格恢复,通过移动事件相机,通过衰减光线雕刻 3D 体素,重建人体姿态和网格,并拟合统计身体模型,实验结果表明该方法在姿态和身体网格估计精度方面优于传统基于帧的方法。
- 从任意多视角图像中恢复人体网格
从任意多视角图像中恢复人体网格涉及两个特点:任意的相机姿态和任意数量的相机视图。为了解决这个问题,我们提出了一个分治框架,用于从任意多视角图像中统一恢复人体网格。
- 多人网格恢复与 Transformers
通过一种面向整体图像的方法,我们提出了一种新的模型设计,其中包括多尺度特征融合、关注机制和相对关节监督,该模型在涉及多个人的各种基准测试中显示出显著的性能提升,超过了最先进的基于区域和基于整体图像的方法。
- CVPR使用姿态和形状的一致性从未见过的视角恢复隐式的三维人体网格
通过神经特征场可以隐含模拟出人类在 3D 空间中的姿态和形状,从而提出了隐式三维人体网格恢复 (ImpHMR) 方法,并通过 Consistency and Self-supervised 的学习方式实现了姿态和形状参数的预测。
- 在 4D 中重建和跟踪人类的 Transformers 技术
本文介绍了一种通过 4DHumans 方法从单眼视频中追踪和重建人体动作的技术,通过 transformerized 版本的 HMR 2.0 网络实现人体重建,使用 3D 重建作为输入在 3D 跟踪系统中进行多人追踪并通过深度学习算法实现姿 - DDT:一种基于扩散驱动的基于 Transformer 框架的视频人类网格恢复方法
本文提出了一种基于扩散驱动变换器的视频人体网格复原框架 (DDT),能有效地提高运动平滑性和时间连续性,并且具有较高的效率和因果性,能够广泛应用于各种实际场景。
- CVPRPOTTER:用于高效人体 Mesh 恢复的汇聚注意力 Transformer
本研究提出一种纯 Transformer 架构,命名为 POoling aTtention TransformER (POTTER),可用于单张图像的 HMR 任务。通过改进池化注意力模块,结合高分辨率特征,POTTER 在减小计算和内存成 - 多视角人体网格翻译器
本文提出一种新的多视角人体网格翻译器(MMT)模型,通过利用多视角图像和视觉转换器来解决单视角方法的病态问题,同时在编码和解码阶段融合不同视角的特征,并通过交叉视图对齐来确保令牌集中于人类姿势和形状。实验表明,MMT 模型在人体网格恢复任务 - ECCV具有跨表示对齐的自监督人体网格恢复
本文介绍了一种针对现有限制的新型人体网格恢复方法,旨在优化存在的域间差距和数据不对称问题,并通过对多个标准数据集的实验验证,取得了与现有模型相媲美的成果,从而进一步降低了人体网格估计所需的注释工作量。
- AAAIPC-HMR:从 2D 图像 / 视频中恢复 3D 人体网格的姿态校准
本文提出了两种新颖的姿态校准框架,采用先进的 3D 姿态估计器和 HMR 序列或并行方式有效地校准人体网格,通过非刚性姿态变换,可以灵活地处理骨长变化以缓解校准后的网格中的误放置,并通过数据驱动学习和几何建模的通用和互补集成来实现,可用于各 - ECCV外观一致性驱动的自监督人体 Mesh 恢复
该论文提出了一种无需成对指导下从单眼图像中推断人体姿态和形状的自我监督的人类网格恢复框架,具有较强的鲁棒性和良好的通用性。
- CVPR人体形状和姿势的端到端恢复
本文提出了一种名为 HMR 的端到端框架,可从单个 RGB 图像恢复人体的完整 3D 网格,通过优化关键点的后投影损失来训练模型,并使用对抗神经网络解决了模型参数欠约束的问题,最终实现了在野外图像中直接从像素预测人体姿态和形状参数的目标。