Text2Immersion: 带有 3D 高斯的生成沉浸式场景

Dec, 2023

Text2Immersion: 带有 3D 高斯的生成沉浸式场景

Text2Immersion: Generative Immersive Scene with 3D Gaussians

Hao Ouyang, Kathryn Heal, Stephen Lombardi, Tiancheng Sun

TL;DRText2Immersion 是一种从文本提示生成高质量 3D 沉浸式场景的优雅方法，可以生成多样化的场景，进一步推动了基于文本的 3D 场景生成。

Abstract

We introduce text2immersion, an elegant method for producing high-quality 3D immersive scenes from text prompts. Our proposed pipeline initiates by progressively generating a gaussian cloud using pre-trained 2D d

text2immersion 3d immersive scenes gaussian cloud text-driven 3d scene generation automated content creation

发现论文，激发创造

DreamScene360: 无约束的文本到 3D 场景生成与全景高斯喷洒

我们提供了一个文本转 3D 360 度场景生成流水线，能够在几分钟内为野外环境创建综合的 360 度场景。我们的方法利用 2D 扩散模型的生成能力和提示自我完善来创建高质量和全局连贯的全景图像，这作为一个初步的 “平面”（2D）场景表示。随后，通过采用粒子技术将它提升到 3D 高斯函数，以实现实时浏览。为了产生一致的 3D 几何结构，我们的流水线通过将 2D 单目深度对齐成全局优化点云，构建了一个空间连贯的结构。这个点云作为 3D 高斯函数的初始状态的质心。为了解决单视角输入固有的不可见问题，我们对合成和输入相机视图应用语义和几何约束作为规范，这些约束指导高斯函数的优化，帮助重建不可见的区域。总之，我们的方法提供了一个全局一致的 360 度视角的 3D 场景，相较于现有技术提供了更加增强的沉浸式体验。项目网址：this http URL

Apr, 2024

Text2Scene：基于文本的室内场景风格化与局部细节

通过引用图像和文本描述，我们提出了一种名为 Text2Scene 的方法，可以自动创建由多个物体组成的虚拟场景的逼真纹理，这种方法在房间的标记三维几何体上增加了详细纹理，使生成的颜色尊重经常由类似材料组成的分层结构或语义部分。

Aug, 2023

RealmDreamer: 基于文本驱动的带修补和深度扩散的 3D 场景生成

介绍了一种名为 RealmDreamer 的技术，可以通过文本描述生成通用的正面视图 3D 场景，并且具备高质量和多样性。该技术利用先进的文本到图像生成器初始化 3D 平面，并通过多个视图进行 3D 修补和基于图像的扩散建模，从而生成富含几何结构的场景。最后，通过图像生成器的锐化样本对模型进行微调，而无需视频或多视角数据，同时还可以从单个图像合成 3D 场景。

Apr, 2024

IM-3D：迭代多视图扩散与重建的高质量 3D 生成

在本文中，我们通过考虑视频生成器，使用高斯喷洒的 3D 重建算法，减少 2D 生成器网络的评估次数 10-100 倍，实现更高效的处理管道，提供更高质量、更少几何不一致性和更多可用的 3D 资源。

Feb, 2024

Guide3D：根据文本和图像指导创建 3D 化身

通过结合文字和图像信息，利用扩散模型，我们开发了一种零样本的三维生成模型，能够合成高分辨率纹理网格，实现了将二维图像直接转化为三维空间的功能。

Aug, 2023

DreamScene: 通过形成模式采样生成基于 3D 高斯的文本到 3D 场景

提出 DreamScene，一个基于 3D 高斯模型的文本生成三维场景框架，使用 Formation Pattern Sampling 和三阶段摄像机采样策略解决现有方法中的质量、一致性、编辑灵活性等问题，通过整合对象和环境实现场景编辑的灵活性，并实验证实其在各种应用中的优越性。

Apr, 2024

FastScene: 基于文本驱动的快速室内三维场景生成

提出了一种名为 FastScene 的快速且高质量的 3D 场景生成框架，通过生成全景图和估计景深来保持场景一致性，并通过多角度投影和 3D 高斯喷洒等策略实现透视视图和场景重建，能在仅 15 分钟内生成一个 3D 场景。

May, 2024

3DDesigner: 基于文本引导扩散模型的照片般逼真的 3D 物体生成和编辑

本文提出了一种基于文本引导扩散模型的 3D 场景生成、编辑和新视角合成方法，并重点讨论了 3D 一致性、本地编辑和单张图像训练等基础问题，取得了较好的效果。

Nov, 2022

GaussianEditor：使用文本指令精细编辑 3D 高斯函数

通过使用高斯编辑器（GaussianEditor）基于 3D 高斯模型的文本指令，可以实现对 3D 场景的精细编辑，相较于之前的方法，具有更快的训练速度和更精准的编辑效果。

Nov, 2023

HD-Fusion: 多噪声估计支持的详细文本到 3D 生成

通过利用 2D 扩散先验提高文本到 3D 内容生成的质量和细节，本文提出了一种结合多个噪声估计过程和预训练的 2D 扩散先验的新方法，实验证明该方法相较于基线能够生成更高质量的细节。

Jul, 2023