Aug, 2024

RSTeller:利用开放数据和大型语言模型在遥感中扩展视觉语言建模

TL;DR本研究解决了遥感图像标注复杂语言语义缺乏的问题。提出了一种利用大型语言模型从OpenStreetMap生成富有语义描述的多模态数据集的工作流程。RSTeller数据集包含超过100万幅遥感图像及其多重描述,显著降低了手动标注的工作量,推动视觉语言建模的进步。