Apr, 2024

GS-LRM: 三维高斯喷射的大规模重建模型

TL;DR我们提出了GS-LRM,一个可扩展的大型重建模型,可以在单个A100 GPU上从2-4个稀疏图像中预测高质量的3D高斯原语,并在0.23秒内完成。我们的模型采用了非常简单的基于transformer的架构;我们对输入的图像进行了分块处理,通过一系列的transformer块将连接的多视图图像令牌传递,并直接从这些令牌解码出每像素的高斯参数以进行可微渲染。与之前仅能重建对象的低秩模型不同,GS-LRM通过预测每像素的高斯分布,能够自然地处理具有不同尺度和复杂性的场景。我们展示了我们的模型可以适用于对象和场景捕捉,并通过在Objaverse和RealEstate10K上进行训练,在这两种情景下,我们的模型都比现有的最先进方法表现得更好。我们还展示了我们模型在下游3D生成任务中的应用。我们的项目网页位于:this https URL。