RealmDreamer: 基于文本驱动的带修补和深度扩散的 3D 场景生成

Apr, 2024

RealmDreamer: 基于文本驱动的带修补和深度扩散的 3D 场景生成

RealmDreamer: Text-Driven 3D Scene Generation with Inpainting and Depth Diffusion

Jaidev Shriram, Alex Trevithick, Lingjie Liu, Ravi Ramamoorthi

TL;DR介绍了一种名为 RealmDreamer 的技术，可以通过文本描述生成通用的正面视图 3D 场景，并且具备高质量和多样性。该技术利用先进的文本到图像生成器初始化 3D 平面，并通过多个视图进行 3D 修补和基于图像的扩散建模，从而生成富含几何结构的场景。最后，通过图像生成器的锐化样本对模型进行微调，而无需视频或多视角数据，同时还可以从单个图像合成 3D 场景。

Abstract

We introduce realmdreamer, a technique for generation of general forward-facing 3d scenes from text descriptions. Our technique optimizes a 3D Gaussian Splatting representation to match complex text prompts. We i

realmdreamer 3d scenes text-to-image generators image-conditional diffusion models geometric structure

发现论文，激发创造

Inpaint3D: 使用 2D 修复扩散生成 3D 场景内容

本文介绍了一种新颖的方法，通过将 2D 扩散模型提炼为学习的 3D 场景表示（例如 NeRF），对给定的有掩模的多视图图像进行 3D 区域修补。

Dec, 2023

隐形缝合：使用深度修复生成平滑的 3D 场景

基于 2D 生成扩散模型的进展，我们在三维场景生成领域做出两个基本贡献：首先，通过引入新型深度完成模型学习三维融合过程，提高场景的几何一致性；其次，基于真实几何关系引入新的场景生成方法基准系统，用于评估场景结构的质量。

Apr, 2024

3D-SceneDreamer: 文本驱动的 3D 一致场景生成

利用文本驱动的 3D 场景生成技术，在构建 3D 场景时通过使用现有的生成模型进行图像变形和修复，同时结合查询和聚合全局 3D 信息来生成高质量的新内容，并在支持多种场景生成和任意相机路径的同时改善视觉效果和 3D 一致性。

Mar, 2024

LucidDreamer: 无域生成三维高斯片状场景

使用现有的大规模扩散式生成模型，LucidDreamer 提出了一种无域场景生成管道，通过完全利用现有的大规模扩散式生成模型的能力来解决现有模型对特定领域场景的限制。

Nov, 2023

DreamInpainter: 基于文本引导的主题驱动图像修复通过扩散模型

本研究介绍了一种新颖的任务 —— 基于文本导向的主题驱动图像修复，它将文本和示例图像结合起来进行图像修复。通过同时适应这两个条件，我们提出了一种两步法的方法 ——DreamInpainter，该方法通过计算密集的主题特征来确保准确的主题复制，并利用一个有区分性的令牌选择模块来消除多余的主题细节，保留主题的身份，同时允许根据其他条件（如遮罩形状和文本提示）进行更改。此外，我们引入了一种解耦正则化技术，以增强在存在示例图像的情况下对文本的控制。我们广泛的实验证明了我们的方法在视觉质量、身份保护和文本控制方面的卓越性能，展示了它在文本导向的主题驱动图像修复的情境中的有效性。

Dec, 2023

DreamFusion: 使用 2D 扩散进行文本到 3D 转换

本文提出了一种使用基于文本转图像的扩散模型进行文本到 3D 合成的方法，该方法绕过了需要大规模标记的 3D 数据集和能够去噪的 3D 数据的限制，将 2D 的扩散模型作为先验，通过梯度下降优化 3D 模型（Neural Radiance Field），并使用概率密度蒸馏引入的损失函数将 2D 扩散模型与 3D 模型相结合。这种方法不需要 3D 训练数据，也不需要修改图像扩散模型，证明了使用预训练的图像扩散模型作为先验的有效性。

Sep, 2022

3DDesigner: 基于文本引导扩散模型的照片般逼真的 3D 物体生成和编辑

本文提出了一种基于文本引导扩散模型的 3D 场景生成、编辑和新视角合成方法，并重点讨论了 3D 一致性、本地编辑和单张图像训练等基础问题，取得了较好的效果。

Nov, 2022

PointDreamer: 从彩色点云中零射线三维纹理网格重建通过二维修复

从有颜色的点云中重建纹理网格是三维图形和视觉中一个重要且具有挑战性的任务。本文提出了一种新型的框架 PointDreamer，通过二维图像修复来提高纹理网格的保真度和清晰度，实现了从有颜色的点云中重建纹理网格的目标。

Jun, 2024

文本和图像引导的 4D 场景生成的统一方法

通过使用扩散生成模型，我们提出了 Dream-in-4D 方法，可以有效地实现从文本和图像生成动态的 3D 场景，该方法包括利用扩散指导学习高质量的静态 3D 资源、使用可变形神经光辐射场将学习的静态资源与形变分离、以及使用多分辨率特征网格和位移总变差损失来学习具有视频扩散指导的运动。通过用户偏好研究，我们证明了与基线方法相比，我们的方法在图像质量、动态一致性和文本保真度方面显著提高了文本到 4D 生成的效果。由于其运动分离表示，我们的方法还可以轻松应用于可控的生成，其中外观由一个或多个图像定义，无需修改运动学习阶段。因此，我们的方法首次提供了一种统一的方法，用于文本到 4D、图像到 4D 和个性化 4D 生成任务。

Nov, 2023

DreamPolisher：面向高质量文本到 3D 生成的几何扩散

通过几何引导的高斯喷洒方法，DreamPolisher 在从文本描述中学习跨视图一致性和复杂的细节，通过两阶段的基于高斯喷洒的方法进行几何一致性的优化和文本细节的改进，有效地生成与文本指令语义紧密相关的一致而真实的 3D 对象。

Mar, 2024