Jun, 2024

SpatialRGPT:视觉语言模型中的基于场景的空间推理

TL;DR通过数据处理和深度信息集成,Spatial Region GPT(SpatialRGPT)提升了Vision Language Models(VLMs)的空间感知和推理能力,并且在空间推理任务中显著提高了性能。