Jan, 2024

FMGS: 嵌入式基础模型的整体三维高斯重叠投射用于全景三维场景理解

TL;DR通过将视觉语言嵌入模型与三维高斯喷洒算法相结合,本研究提出了一种高效的三维视觉语言模型重建方法,通过渲染从三维模型生成的特征映射,实现了高质量的渲染和快速训练,并引入了像素对齐损失来保证渲染的语义一致性,取得了显著的多视图语义一致性,为增强对无控制的现实环境中场景的理解铺平了道路。