在 Common Crawl 语料库中量化地理空间
在这篇论文中,我们探讨了机器学习在地理空间预测任务中的应用,提出了一种名为 GeoLLM 的新方法,利用大型语言模型中的地理空间信息和开放街道地图的辅助数据,有效地提取地理空间知识,用于测量人口密度等中心问题,相较于最近邻和直接使用提示信息的基准方法,在多个任务上展现了 70% 的性能提升,并且与卫星数据的基准结果相当甚至超出,证明了大型语言模型在地理空间任务上的可行性和潜力。
Oct, 2023
该研究通过探测具备预训练能力的大型语言模型对地理数据的理解程度和与此相关的促进地理空间决策的能力,通过三个实验验证结论,表明合成地理空间知识需要更大规模和更复杂的语言模型,并且对于处理地理空间信息,大型语言模型的潜力和局限性值得研究。
Oct, 2023
通过使用 Common Crawl 作为带注释的地理空间数据的来源,该研究论文提出了一个高效的流水线来从 CC 中的 GPX 文件中提取带注释的用户生成轨迹,并生成了包含 1,416 对人工书写描述和 MultiLineString 矢量数据的多模态数据集,该数据集可用于研究人们的室外活动模式、人们谈论自己室外体验的方式,以及轨迹生成或轨迹注释模型的开发。
May, 2024
GeoLM 是一个地理信息语言模型,通过连接文本语料库中的语言信息和来自地理数据库的地理信息,利用对比学习和遮蔽语言建模的方法,结合空间坐标嵌入机制来捕捉地理空间上下文,从而提升自然语言中的地理实体的理解能力。实验证明 GeoLM 在地名识别、地名链接、关系提取和地理实体类型等方面具有良好的能力,弥合了自然语言处理和地理空间科学之间的差距。
Oct, 2023
通过进行一系列实验,我们研究了多模态大型语言模型在地理和地理空间领域的知识和能力,重点关注前沿模型 GPT-4V 的视觉能力,并与开源模型进行性能比较。我们的方法涉及使用一套地理任务的小规模基准测试这些模型,测试它们在不同难度任务上的能力。分析结果揭示了这些模型的优点,包括超过人类的性能,并揭示了它们的不足之处,提供了它们在地理领域能力的全面视角。为了促进未来模型的比较和评估,我们将公开发布我们的基准测试。
Nov, 2023
本篇研究探究 GPT-4 模型应用于地理数据场景问题的解决能力,试图了解其是否具备对地理位置、距离、海拔,以及更复杂的问题如国家轮廓、旅游网络、路线规划和供应链分析的理解和解决能力。结果表明该模型在一定程度上具备对世界的认识,但仍存在限制。
May, 2023
我们提出了一个评估大型语言模型(LLM)判断地理位置之间的斜对角方向能力的基准,并将其应用于三个知名的 LLM:GPT-3.5,GPT-4 和 Llama-2。在测试中,GPT-4 表现出优越的性能,准确率为 55.3%,其次是 GPT-3.5 的 47.3%,Llama-2 的 44.7%。尽管这些模型在可能存在层次性偏差的任务上的准确性较低,但它们大多数情况下能够识别最近的基准方向,显示出类似人类的错误理解,我们讨论了直接用代表地理关系的文本数据来改进 LLM 的空间推理能力的潜力。
Jan, 2024
利用多模态语言模型,我们系统评估其图片地理定位能力,并通过新的图像数据集和全面的评估框架进行训练及非训练的评估。结果表明,闭源模型展示出更好的地理定位能力,而开源模型通过微调可达到相当的性能。
May, 2024
研究使用大型语言模型(LLMs)对几何形状及其空间关系进行表示的能力,并使用 GPT-2 和 BERT 等 LLMs 对几何形状的文本(WKT)格式进行编码,然后将其嵌入分类器和回归器中评估 LLMs 生成的嵌入表示对几何属性的效果。实验证明,尽管 LLMs 生成的嵌入可以保留几何类型并捕捉一些空间关系(准确率高达 73%),但在估计数值和检索空间相关对象方面仍存在挑战。此研究强调了在捕捉底层地理空间数据的细微差别和复杂性以及整合领域知识以支持各种基于 GeoAI 应用的需要改进的重要性。
Jul, 2023
本文提出了一种基于自然语言问题的问答引擎,用于处理大量地理空间数据的查询,该引擎可以对连接的地理空间数据源进行查询,采用 SPARQL 或 OGC 标准扩展 GeoSPARQL,研究者们可以使用我们提供的 201 个自然语言问题数据集来评估该引擎的性能。
Jul, 2020