Jun, 2023

RS5M:一种用于遥感视觉语言的大规模数据集和基础模型

TL;DR本文提出了一种新的框架,包括领域基础模型(DFM),该模型缩小了通用基础模型(GFM)和特定领域下游任务之间的差距,并通过预训练的 VLM 将筛选后的遥感图像与英文描述进行配对,构成了第一个大规模遥感图像 - 文本匹配数据集。在该数据集上的实验结果表明,使用上述数据集和提出的 DFM 方法的零样本分类和视觉语言检索任务的性能都较好,并且 RS Stable Diffusion 模型的训练也取得了成功的结果。