远程传感平台中的工具增强智能代理评估
利用大规模遥感图像 - 文本数据集和遥感特定指令数据集,我们构建了针对遥感图像理解的多模态大语言模型(MLLM)LHRS-Bot,通过新颖的多层次视觉 - 语言对齐策略和课程学习方法,展现了在遥感领域中深入理解遥感图像和进行细致推理的能力。
Feb, 2024
提出使用大型语言模型(LLM)驱动的遥感智能代理 RS-Agent 来解决遥感应用中的复杂问题,通过整合高性能的遥感图像处理工具和利用有力的知识文档回答专业问题,实验结果表明 RS-Agent 在场景分类等任务中具有出色性能。
Jun, 2024
GeoChat 是第一个多功能的遥感视觉语言模型,它具备高分辨率遥感图像的多任务对话能力,并能将对象视觉上地与其空间坐标相关联,通过扩展现有多样的遥感数据集中的图像 - 文本对生成了一个新的领域特定的多模态指令跟随数据集,成功解决了现有模型在遥感领域的局限性,并在各个遥感任务上展示了强大的零样本性能。
Nov, 2023
地理空间联合指挥系统通过自然语言指令释放了执行地球观测应用的前所未有的潜力。本研究介绍了 GeoLLM-Engine,这是一个环境,用于工具增强的代理人执行遥感平台上由分析师经常执行的复杂任务。我们丰富了我们的环境,配备了地理空间 API 工具、动态地图 / UI 和外部多模态知识库,以准确评估代理人在解释真实高级自然语言命令和任务完成的功能正确性方面的能力。通过减轻与人在环回式基准策划相关的开销,我们利用 100 个 GPT-4-Turbo 节点的大规模并行计算引擎,覆盖了超过 50 万个多样化的多工具任务和 110 万幅卫星图像。通过超越传统的单任务图像描述范式,我们研究了最先进的代理人和提示技术在面对长期视角提示时的性能。
Apr, 2024
通过进行一系列实验,我们研究了多模态大型语言模型在地理和地理空间领域的知识和能力,重点关注前沿模型 GPT-4V 的视觉能力,并与开源模型进行性能比较。我们的方法涉及使用一套地理任务的小规模基准测试这些模型,测试它们在不同难度任务上的能力。分析结果揭示了这些模型的优点,包括超过人类的性能,并揭示了它们的不足之处,提供了它们在地理领域能力的全面视角。为了促进未来模型的比较和评估,我们将公开发布我们的基准测试。
Nov, 2023
提出了一个先驱性的多模态大型语言模型(MLLM)EarthGPT,该模型集成了各种多传感器遥感图像解释任务,通过构建大规模的多传感器多模态遥感指令追踪数据集 MMRS,解决了 MLLM 在遥感领域缺乏专业知识的问题,并在各种遥感图像解释任务上展现出其卓越的性能,并为开放式推理任务提供了一种多功能的范例。
Jan, 2024
大规模语言模型的出现显著推动了人工智能的快速发展,并引发了人工智能 2.0 的革命。远程感知领域对于开发专门针对数据分析的大规模视觉语言模型越来越感兴趣。然而,目前的研究主要集中在视觉识别任务上,缺乏对齐并适用于训练大规模视觉语言模型的全面、大规模图像 - 文本数据集,这对于有效训练此类模型构成了重大挑战。本研究构建了一个高质量的远程感知图像字幕数据集(RSICap),用于促进 RS 领域大规模视觉语言模型的发展。与以往通过模型生成的字幕或简短描述的数据集不同,RSICap 包括 2,585 个人工注释的字幕,具备丰富和高质量的信息。该数据集为每个图像提供了详细的描述,包括场景描述(例如居住区、机场或农田)以及对象信息(例如颜色、形状、数量、绝对位置等)。为了促进在 RS 领域中对视觉语言模型的评估,我们还提供了一个基准评估数据集 RSIEval,它包括人工注释的字幕和视觉问答对,可以全面评估在 RS 背景下的视觉语言模型。
Jul, 2023
在这篇论文中,我们探讨了机器学习在地理空间预测任务中的应用,提出了一种名为 GeoLLM 的新方法,利用大型语言模型中的地理空间信息和开放街道地图的辅助数据,有效地提取地理空间知识,用于测量人口密度等中心问题,相较于最近邻和直接使用提示信息的基准方法,在多个任务上展现了 70% 的性能提升,并且与卫星数据的基准结果相当甚至超出,证明了大型语言模型在地理空间任务上的可行性和潜力。
Oct, 2023
该研究通过探测具备预训练能力的大型语言模型对地理数据的理解程度和与此相关的促进地理空间决策的能力,通过三个实验验证结论,表明合成地理空间知识需要更大规模和更复杂的语言模型,并且对于处理地理空间信息,大型语言模型的潜力和局限性值得研究。
Oct, 2023
本研究提出一种基于大型语言模型的 AI 地理信息系统 (Autonomous GIS),通过自动化的空间数据收集、分析和可视化,解决空间问题。Autonomous GIS 的设计原则包括信息充足性、LLM 能力和代理架构,能够实现自动生成、自组织、自验证、自执行和自增长等五个自主目标,从而以更快、更简单、更可靠的方式进行空间分析。
May, 2023