Mar, 2024

G3DR:ImageNet 中的生成式 3D 重建

TL;DR我们介绍了一种新颖的 3D 生成方法,Generative 3D Reconstruction (G3DR) in ImageNet,能够从单个图像中生成多样且高质量的 3D 物体,解决了现有方法的局限性。我们的框架核心是一种新颖的深度正则化技术,能够实现高几何保真度的场景生成。G3DR 还利用预训练的语言 - 视觉模型,如 CLIP,实现对新视角的重构,提升生成物体的视觉真实感。此外,G3DR 设计了简单但有效的采样过程,进一步提高生成的质量。G3DR 基于类别或文本条件提供多样且高效的 3D 资产生成。尽管 G3DR 十分简单,但在感知度量上,它能够胜过业界先进的方法,在几何评分上提高了 90% 并在感知度量上提高了 22%,同时只需一半的训练时间。代码可在此 https URL 找到。