Aug, 2024

基于视觉-语言模型实现建筑环境零注释的方法

TL;DR本研究解决了高保真建筑环境数字表示需求与高成本人工注释之间的矛盾。通过使用视觉-语言模型和分段策略,抵消了对人工注释的依赖,实验结果显示,采用预分段策略的模型在多个城市特征的注释中达到了接近40%的交并比准确率。这一发现为自动注释建筑环境的研究开辟了新方向,以提升公平性、可及性和安全性。