Jan, 2024
FMGS: 嵌入式基础模型的整体三维高斯重叠投射用于全景三维场景理解
FMGS: Foundation Model Embedded 3D Gaussian Splatting for Holistic 3D Scene Understanding
Xingxing Zuo, Pouya Samangouei, Yunwen Zhou, Yan Di, Mingyang Li
TL;DR通过将视觉语言嵌入模型与三维高斯喷洒算法相结合,本研究提出了一种高效的三维视觉语言模型重建方法,通过渲染从三维模型生成的特征映射,实现了高质量的渲染和快速训练,并引入了像素对齐损失来保证渲染的语义一致性,取得了显著的多视图语义一致性,为增强对无控制的现实环境中场景的理解铺平了道路。