GTR:通过几何和纹理细化改进大型三维重建模型
我们提出了第一个大规模重建模型 (LRM),能够在仅 5 秒内从单个输入图像预测对象的 3D 模型。与许多以类别为基础在小规模数据集(如 ShapeNet)上训练的先前方法不同,LRM 采用一个高度可扩展的基于 transformer 的架构,具有 5 亿个可学习参数,能够直接从输入图像预测神经辐射场(NeRF)。我们以端到端的方式在包含大约 100 万个对象的海量多视图数据上训练我们的模型,包括 Objaverse 的合成渲染和 MVImgNet 的真实采集数据。这种高容量模型和大规模的训练数据的组合使得我们的模型具有很强的通用性,并能够从各种测试输入中生成高质量的 3D 重建结果,包括真实世界中的野外捕捉和生成模型的图像。可在此网站找到视频演示和可交互的 3D 网格:[https://this_URL]。
Nov, 2023
MVG-NeRF 组合了传统的多视角几何算法和神经辐射场 (NeRF) 用于基于图像的三维重建。我们提出使用像素级深度和法线来引导 NeRF 优化,以提高所估计表面的质量。实验结果表明,该方法可以从图像中获取干净的三维网格,同时在新视角合成方面具有竞争力的表现。
Oct, 2022
该研究介绍了一种名为几何感知大型重建模型(GeoLRM)的方法,该方法可以使用 512k 个高斯函数和 21 个输入图像在仅需 11 GB 的 GPU 内存中预测高质量的资源。该模型通过引入一种新颖的三维感知变换器结构和可变形交叉注意机制来解决现有方法在表达低分辨率和提高质量的密集视图方面的局限性,实现了三维结构和二维图像之间的有效融合,并在三维生成任务中表现出显著的性能优势。
Jun, 2024
提出了 MeshLRM,一种基于 LRM 的新方法,在不到一秒的时间内仅使用四个输入图像进行高质量网格的重建。与以往的大型重建模型(LRMs)不同,MeshLRM 在 LRM 框架中融入了可微分网格提取和渲染,可通过微调预训练的 NeRF LRM 进行端到端的网格重建。此外,通过简化先前 LRMs 中的多个复杂设计,我们改进了 LRM 架构。MeshLRM 的 NeRF 初始化使用低分辨率和高分辨率图像进行顺序训练;这种新的 LRM 训练策略实现了显著更快的收敛速度,从而在更少的计算量下获得更好的质量。我们的方法在稀疏视图输入下实现了最先进的网格重建,并且还可应用于很多下游应用,包括文本到三维和单图像到三维的生成。项目页面:此链接。
Apr, 2024
通过引入跨视图一致的交叉注意力机制和利用三维先验信息,提出了一种高效的多视角大型重建模型 (M-LRM),能够从多视图中以三维感知的方式高质量地重建三维形状,并且相比于 LRM 能够生成分辨率为 $128 imes 128$ 的三平面 NeRF,具有更高的保真度和训练收敛速度。
Jun, 2024
Text2NeRF 是一种基于 NeRF 模型以自然语言描述为输入的 3D 场景生成方法,利用预训练的文本到图像扩散模型和单目深度估计方法约束 NeRF 模型以保持内容和几何一致,同时使用逐步场景修复和更新策略保证场景视角一致性。实验结果表明该方法能够生成高保真度,多视角一致性和多样性的真实感 3D 场景。
May, 2023
我们提出了一种新颖的 3D 生成方法 DMV3D,该方法使用基于变压器的 3D 大型重建模型对多视差扩散进行去噪。我们的重建模型采用了三平面 NeRF 表示,并且可以通过 NeRF 重建和渲染对嘈杂的多视差图像进行去噪,能在单个 A100 GPU 上实现约 30 秒的单阶段 3D 生成。我们使用大规模多视差图像数据集训练 DMV3D,仅使用图像重建损失,而不访问 3D 资产。我们展示了在需要对未见过的物体部分进行概率建模以生成具有清晰纹理的多样重建的单图像重建问题上的最新成果,以及优于以往的 3D 扩散模型的高质量文本到 3D 生成结果。我们的项目网站位于此 https URL。
Nov, 2023
提出了 MVSNeRF,这是一种新颖的神经渲染方法,可以通过快速网络推理从仅三个附近输入视图重建辐射场,利用平面扫描代价体进行几何感知场景推理,并将其与基于物理的体积渲染相结合,能够横跨场景(甚至是室内场景)泛化,并仅使用三个输入图像生成逼真的视图合成结果,比类似工作在可推广的辐射场重建方面表现显著优越。
Mar, 2021
利用 Human-LRM 模型,我们可以从一张单一图像中预测人类神经辐射场。通过使用包含 3D 扫描和多视角捕获的大型数据集进行训练,我们的方法展现出了惊人的适应性。此外,为了增强模型在野外场景(尤其是存在遮挡情况下)中的适用性,我们提出了一种将多视角重建转化为单视角的新策略,即条件三平面扩散模型。这个生成式扩展方法解决了从单个视角观察时人体形状的固有变化,并使得从遮挡图像中重建完整的人体成为可能。通过大量实验证明,Human-LRM 在多个基准测试中显著超越了以往的方法。
Jan, 2024
通过增加位置特定的采样技术和多镜头分块策略,我们在大规模航拍数据集上扩展了 Neural Radiance Fields (NeRF) 模型,并对 NeRF 的几何特性进行了全面评估。我们的方法 Mip-NeRF 在几何性能上相较于传统方法具有更好的完整性和物体细节,但目前仍然在准确度方面存在不足。
Oct, 2023