Feb, 2024

注意模态差异:通过交叉模态对齐实现遥感视觉语言模型

TL;DR通过鲁棒的微调与跨模态对齐,本研究提出了一种方法,旨在将 RS(Remote Sensing)图像模态与 CLIP 的视觉和文本模态对齐,从而在 RS 图像分类和跨模态检索任务中获得显著的性能提升。