Feb, 2024

零样本遥感图像场景分类的深度语义视觉对齐

TL;DR我们通过机器自动收集可视属性,并利用转换器中的自注意机制将局部图像区域关联起来,集成背景上下文信息进行预测,以解决远程感知场景分类中的零样本学习问题。通过广泛实验,我们展示了我们的模型在具有挑战性的大规模远程感知场景分类基准上优于其他最先进模型。