Nov, 2023
GeoChat: 用于遥感的基于大规模视觉语言模型的实体化系统
GeoChat: Grounded Large Vision-Language Model for Remote Sensing
TL;DRGeoChat是第一个多功能的遥感视觉语言模型,它具备高分辨率遥感图像的多任务对话能力,并能将对象视觉上地与其空间坐标相关联,通过扩展现有多样的遥感数据集中的图像-文本对生成了一个新的领域特定的多模态指令跟随数据集,成功解决了现有模型在遥感领域的局限性,并在各个遥感任务上展示了强大的零样本性能。