Mar, 2024

Popeye: 面向遥感图像的多源船舶检测的统一视觉语言模型

TL;DR提出了一种名为Popeye的新型统一视觉-语言模型,用于从遥感图像中进行多源船只检测,通过设计一种新的图像-指令-答案方式和跨模态图像解释方法,实现了各种船只检测方式的统一标签,同时利用知识迁移机制和分段任意模型(SAM)来提高检测性能,实验证明该方法在零样本多源船只检测方面优于当前的专家模型、开放词汇模型和其他视觉-语言模型。