Feb, 2024

GALA3D:基于布局导向的生成式高斯雾化技术实现文本到复杂 3D 场景生成

TL;DR我们提出了 GALA3D,一种具备布局引导控制的生成式 3D 高斯模型,用于有效的文本到 3D 生成。我们首先利用大型语言模型(LLMs)生成初始布局,并引入了布局引导的 3D 高斯表示,以适应几何约束下的 3D 内容生成。然后,我们使用条件扩散的对象场景组合优化机制协同生成具有一致几何、纹理、比例和准确互动的真实 3D 场景,同时调整从 LLMs 中提取的粗略布局优先级以与生成的场景相一致。实验证明,GALA3D 是一个用户友好的端到端框架,可用于最先进的场景级 3D 内容生成和可控制的编辑,并确保场景中的物体级实体的高保真度。源代码和模型可在此网址获得:https://example.com