BriefGPT.xyz
Ask
alpha
关键词
large-scale vision language model
搜索结果 - 1
通过地面遥感对齐构建无需注释的遥感视觉 - 语言基础模型
我们提出了一种基于视觉语言模型训练遥感图像的方法,无需使用任何文本注释。我们的关键洞察力是使用地面上的互联网图像作为遥感图像和语言之间的中介。通过使用大量的配对互联网和卫星图像,我们训练了遥感图像的图像编码器与 CLIP 的图像编码器对齐。
→
PDF
7 months ago
Prev
Next