Apr, 2024

ELEV-VISION-SAM: 综合视觉语言和基础模型用于建筑物最低地板高程的自动估计

TL;DR该研究通过将Segment Anything模型与视觉语言模型相结合,对街景图像进行文本提示图像分割,从而改进了街景图像的分割质量及其在低洼地区的可见性估计模型,从33%提高到56%。这个方法不仅推进了城市分析中的街景图像分割,还为其他土木工程和基础设施分析任务的图像分割提供了新的方法。