NeRDi: 基于语言引导扩散的单视角 NeRF 综合技术作为通用图像先验
本文提出了一种称为 SSDNeRF 的新方法,它使用表达能力强的 Diffusion Model 从多视图图像中学习神经辐射场(NeRF)的可推广先验,实现 3D 重建和先验学习的同时,证明了该方法在无条件生成和单 / 稀疏视图 3D 重建等任务上具有与任务特定方法媲美或优于其的鲁棒性结果。
Apr, 2023
使用少量照片重建现实场景的方法,通过在合成和多视图数据集上训练的扩散先验来对新视角的合成进行规范化,从而在超约束区域综合出逼真的几何和纹理,同时保持观察区域的外观。与以前的少视图 NeRF 重建方法相比,我们在各种真实世界数据集上进行了广泛评估,包括正向和 360 度场景,并展示了显著的性能改进。
Dec, 2023
通过使用 Geometry-enhanced NeRF (G-NeRF) 方法,在 novel view synthesis 中增强几何先验,通过几何引导的多视角合成方法和深度感知型训练,解决了多视角数据不足和单视角图像几何先验提取问题,并通过定剪方法和深度感知鉴别器进一步提高了几何品质。实验证明了我们方法在定量和定性结果上的有效性。
Apr, 2024
通过将预训练的二维扩散模型引入神经光辐射场(NeRFs),文本到三维生成方法取得了巨大的进展,其中许多最先进的方法通常使用得分蒸馏采样(SDS)来优化 NeRF 表示,该方法通过预训练的文本条件的二维扩散模型(例如 ImData)监督 NeRF 优化。然而,由这种预训练扩散模型提供的监督信号仅依赖于文本提示,并不限制多视角一致性。为了将跨视角一致性引入扩散先验中,一些最近的工作通过多视角数据微调二维扩散模型,但仍缺乏细粒度的视图连贯性。为了解决这个挑战,我们将多视角图像条件纳入 NeRF 优化的监督信号中,明确强制执行细粒度的视图一致性。通过这种更强的监督,我们提出的文本到三维方法有效地减轻了由于过高密度而产生的浮动点和由于密度不足而形成的完全空白空间。我们在 T$^3$Bench 数据集上的定量评估表明,我们的方法在现有的文本到三维方法中达到了最先进的性能。我们将公开发布代码。
Dec, 2023
我们将来自未知姿态的多视图重建问题作为一个生成建模问题。通过一组未标注的场景的 2D 图像,我们的方法同时学习了一个网络来预测从 2D 图像输入中的相机姿态,并学习了用于 3D 场景的神经辐射场(NeRF)的参数。通过在标准去噪目标下使用去噪扩散概率模型(DDPM)将姿态预测网络和 NeRF 结合在一起并训练系统来推动学习进展。我们的框架要求系统通过预测图像的姿态并渲染 NeRF 来完成去噪输入 2D 图像的任务。学习去噪因此迫使系统同时学习底层的 3D NeRF 表示和从图像到摄像机外参数的映射。为了促进后者,我们设计了一个自定义的网络架构来将姿态表示为一个分布,从而在仅进行去噪训练时具备发现视图对应关系的隐式能力。这种技术允许我们的系统成功构建 NeRFs,并在竞争方法失败的具有挑战性的场景中使用。在训练结束时,我们学习到的 NeRF 可以被提取并用作 3D 场景模型;我们的完整系统可以用于采样新的相机姿态并生成新的视角图像。
Jun, 2024
本研究提出利用全局和局部特征构建表达式三维模型的方法,通过训练 MLP 网络,实现从单个未定位图像中合成新视角,并在多个物体类别上进行泛化,获得了比现有方法更出色的性能和更丰富的细节渲染。
Jul, 2022
我们提出了一种简单而有效的框架 Efficient-3DiM,用于学习单张图像的新视角合成器,通过减小训练开销,包括精心设计的时间步长采样策略、更优质的三维特征提取器和增强的训练方案,实现了将总训练时间从 10 天缩短到不到 1 天,并在相同计算平台上(8 个 Nvidia A100 GPU 实例)加速训练过程。我们进行了全面的实验来证明我们提出方法的高效性和广泛适用性。
Oct, 2023
我们提出了一种新颖的 3D 生成方法 DMV3D,该方法使用基于变压器的 3D 大型重建模型对多视差扩散进行去噪。我们的重建模型采用了三平面 NeRF 表示,并且可以通过 NeRF 重建和渲染对嘈杂的多视差图像进行去噪,能在单个 A100 GPU 上实现约 30 秒的单阶段 3D 生成。我们使用大规模多视差图像数据集训练 DMV3D,仅使用图像重建损失,而不访问 3D 资产。我们展示了在需要对未见过的物体部分进行概率建模以生成具有清晰纹理的多样重建的单图像重建问题上的最新成果,以及优于以往的 3D 扩散模型的高质量文本到 3D 生成结果。我们的项目网站位于此 https URL。
Nov, 2023
DiSR-NeRF 是一个利用扩散引导的框架来实现视图一致的超分辨率 NeRF,该方法通过利用现有的强大 2D 超分辨率模型来规避高分辨率参考图像的要求,并通过 NeRF 的内在多视图一致性属性提出了迭代的 3D 同步技术来减轻 LR 渲染图像之间不一致的问题。通过 Renoised Score Distillation,我们进一步引入了一种新颖的用于 2D 图像分辨率的评分蒸馏目标函数。我们的 DiSR-NeRF 在合成和真实世界数据集上进行的定性和定量结果表明,与现有方法相比,我们的方法在 NeRF 超分辨率上可以取得更好的效果。
Apr, 2024