Jun, 2024

MGIMM:面向属性引导的遥感影像细节描述的多粒度指令多模态模型

TL;DR本文提出了一种属性引导的多粒度指令多模型(MGIMM),用于遥感图像的详细描述,并通过在区域级别指导调整实现了多模型的一致性学习。通过多颗粒度的视觉特征,MGIMM 可以充分感知区域级和全局图像信息,利用大语言模型对遥感图像进行全面的描述。实验证明了 MGIMM 的区域 - 属性引导学习方法的有效性。