BriefGPT.xyz
Ask
alpha
关键词
multimodal instruction-following dataset
搜索结果 - 1
GeoChat: 用于遥感的基于大规模视觉语言模型的实体化系统
GeoChat 是第一个多功能的遥感视觉语言模型,它具备高分辨率遥感图像的多任务对话能力,并能将对象视觉上地与其空间坐标相关联,通过扩展现有多样的遥感数据集中的图像 - 文本对生成了一个新的领域特定的多模态指令跟随数据集,成功解决了现有模型
→
PDF
7 months ago
Prev
Next