Sep, 2024

增强遥感视觉-语言模型的零样本场景分类

TL;DR本文解决了传统零样本场景分类中,遥感视觉-语言模型通过对大图像分割成小patch而忽略上下文信息的问题。我们提出了一种新方法,利用基于文本提示的初步预测和图像编码器的patch关联关系,以增强零样本分类的能力,实验结果显示在10个遥感数据集上相较于传统方法实现了显著的准确率提升。