Apr, 2024

RealmDreamer: 基于文本驱动的带修补和深度扩散的 3D 场景生成

TL;DR介绍了一种名为 RealmDreamer 的技术,可以通过文本描述生成通用的正面视图 3D 场景,并且具备高质量和多样性。该技术利用先进的文本到图像生成器初始化 3D 平面,并通过多个视图进行 3D 修补和基于图像的扩散建模,从而生成富含几何结构的场景。最后,通过图像生成器的锐化样本对模型进行微调,而无需视频或多视角数据,同时还可以从单个图像合成 3D 场景。