Mar, 2024

GRM:高效的大型高斯重建模型用于 3D 重建和生成

TL;DR我们介绍了 GRM,一个能够从稀疏视图图像中在大约 0.1 秒内恢复 3D 资产的大规模重构器。GRM 是一个前馈变换器模型,能够高效地将多视图信息结合起来,将输入像素翻译成像素对齐的高斯分布,通过反投影生成一系列密集分布的 3D 高斯分布来表示场景。我们的变换器架构和使用 3D 高斯分布的方法共同构成了一个可扩展且高效的重构框架。广泛的实验结果证明,我们的方法在重构质量和效率方面优于其他替代方法。我们还展示了 GRM 在生成任务中的潜力,即将其与现有的多视图扩散模型集成,如文本到 3D 和图像到 3D。有关我们的项目网站,请访问:this https URL