Jan, 2024

SkyEyeGPT: 大型语言模型中通过指令调整实现遥感视觉 - 语言任务的统一

TL;DRSkyEyeGPT 是一个针对远程感知视觉语言理解而设计的统一的多模态大型语言模型,通过对视觉特征与语言域的对齐以及使用 LLM 的 RS 解码器来预测远程感知开放式任务的答案,在 RS 视觉语言任务中表现出卓越的图像级和区域级任务结果。