- GTR:通过几何和纹理细化改进大型三维重建模型
我们提出了一种新的方法,从多视角图像中进行 3D 网格重建。我们的方法借鉴了像 LRM 这样的大型重建模型,使用了基于 Transformer 的三面体生成器和在多视角图像上进行训练的神经辐射场(NeRF)模型。然而,在我们的方法中,我们引 - Era3D:高分辨率多视角扩散利用高效分行注意力
Era3D 是一种多视角扩散方法,通过单视角图像生成高分辨率的多视角图像。它提出了扩散式的摄像机预测模块以准确估计输入图像的焦距和仰角,使用行向注意力层来加强多视角扩散中的极线先验,实现高质量的多视角图像生成和具体的 3D 网格重建。
- CVPRPLIKS: 一种用于 3D 人体估计的伪线性反向运动学求解器
本论文提出了一个基于模型优化的方法,称之为 PLIKS,能够通过简单的线性反演公式从单个 2D 图像中重建出人体的 3D 模型,相较于其他先进的方法,PLIKS 能够达到更高的精确度,同时也具备灵活性,可以加入其他约束条件。
- CVPR从运动学习骨骼类目的单目三维重建
使用视频自监督和模板形变技术来实现单目 3D 重建并且进行数值优化,以便使计算得出的模型更加准确和具有解释性。
- 野外一致网格重建的在线适应
本文提出了一种算法,用于从野外视频中重建变形对象实例的时间一致 3D 网格,不需要每个视频帧的 3D 网格注释,2D 关键点或相机姿态,而是将基于视频的重建构建为适用于任何传入测试视频的自监督在线适应问题。
- ICCV基于拓扑修改网络的单 RGB 图像深度网格重建
该论文提出了一种基于深度学习的单视图网格重建框架,能够从单个 0 维模板网格生成具有复杂拓扑结构的高质量网格,其关键在于交替使用网格变形和拓扑修改两个网络。
- ICCV利用多视角图像进行形状感知人体姿态和形状重建
使用多视角图像建议一种可伸缩的神经网络框架来重建 SMPL 模型子空间中的人体 3D 网格,并在现实图像上表现优异,特别是在形状估计方面。
- 从单目 RGB 图像恢复端到端的手部网格
本文提出了 HAnd Mesh Recovery (HAMR) 框架,通过参数化通用 3D 手模型的形状和相对 3D 关节角度,提供了更多表达和更有用的网格表示,该框架可从单个 RGB 图像重建人手的完整 3D 网格,并具有较好的表现。
- CVPR人体形状和姿势的端到端恢复
本文提出了一种名为 HMR 的端到端框架,可从单个 RGB 图像恢复人体的完整 3D 网格,通过优化关键点的后投影损失来训练模型,并使用对抗神经网络解决了模型参数欠约束的问题,最终实现了在野外图像中直接从像素预测人体姿态和形状参数的目标。