- 未知之地:生成新环境的地理描述
通过构建基于地理空间数据的知识图谱,利用上下文无关文法(CFG)和大型语言模型 (LLM) 生成导航指令,本研究提出了一种用于生成高质量合成数据的大规模增强方法,以解决新环境下训练数据不足的问题。结果显示,通过 CFG 增强训练的模型在未知 - GFM4MPM:面向矿产潜力地图的地理空间基础模型
研究了使用无标签地理空间数据的自监督方式进行预训练,以实现对矿产潜力的预测,并采用可解释的人工智能技术解释预测结果。
- 面向视觉 - 语言地理基础模型:一项调查
本文全面审查了视觉 - 语言地理基础模型(VLGFMs),总结和分析了该领域的最新发展,包括 VLGFMs 的背景、动机、核心技术和应用,以及未来研究方向的洞察、问题和讨论。
- SeeFar:卫星无关的多分辨率地理空间基础模型数据集
SeeFar 数据集是一个多分辨率卫星图像数据集,用于训练地理空间基础模型,解决商业卫星图像的高成本和有限历史可用性对基础模型训练的影响,并实现多源数据标准化和增强互操作性。
- 在 Common Crawl 语料库中量化地理空间
分析大型语言模型对 Common Crawl 数据集的地理空间数据的利用率,发现 1/5 至 1/6 的文档中包含有经纬度和街道地址等地理空间信息,为进一步研究有关地理空间内容对大型语言模型的影响提供了定量的见解。
- 基于 OpenStreetMap 和 H3 网格的全球规模时空知识图谱
基于开放街道地图 (OpenStreetMap) 数据,我们提出了一个支持全球范围的 OpenStreetMap 数据转化成时空知识图谱的框架,同时利用 Apache Sedona 作为计算框架来构建该图谱。
- CC-GPX: 从 Common Crawl 抽取高质量注释的地理空间数据
通过使用 Common Crawl 作为带注释的地理空间数据的来源,该研究论文提出了一个高效的流水线来从 CC 中的 GPX 文件中提取带注释的用户生成轨迹,并生成了包含 1,416 对人工书写描述和 MultiLineString 矢量数 - Desk-AId: 人道救援桌面评估与地理空间人工智能预测地雷区域
Desk-AId 通过使用地理空间数据和社会经济信息来估计地雷风险,支持桌面评估阶段,包括混合数据采样策略和历史冲突和多领域设施(如建筑物,道路,卫生设施)的上下文增强。该方法在两个领域进行地雷风险评估,提高了不同分类模型的估计准确性。
- 地质时间序列的去噪处理:基于时空图神经网络的应用于慢滑事件提取
本研究设计了一种多站点时空图形注意力去噪器,通过学习 GNSS 噪声的潜在特征以达到亚毫米精度的慢滑事件相关位移去噪,验证了该方法与震颤的良好时空相关性。
- 面向数据的机器学习在地理遥感数据中的应用
现代机器学习在地理空间领域取得了巨大的进展,而数据中心学习方法的应用对于提高精度、泛化能力和实际应用产生了积极作用。本文提出了一种自动化数据中心学习方法的定义和精确分类,总结了地理空间领域的相关研究,并将其归类为不同的组别,通过具体的实现例 - SatCLIP:卫星图像中的全球通用位置嵌入
Satellite Contrastive Location-Image Pretraining (SatCLIP) is a global geographic location encoder that provides vector - 通用地理空间人工智能的基础模型
基于深度学习的 Prithvi 地球观测模型通过高效前期训练和微调,成功实现地球观测领域多个任务的优化,证明了预训练模型在加速微调过程以及在性能上优于随机初始化权重的作用,并表明可显著减少可用标注数据的数量而不影响模型准确性。
- SRAI: 地理空间人工智能标准化调研
该研究论文介绍了一种名为 “Spatial Representations for Artificial Intelligence(srai)” 的 Python 库,用于处理地理空间数据,包括下载数据、将给定区域划分为微区域并使用不同架构 - CityFM:解决城市挑战的城市基础模型
通过开放地理空间数据和自我监督学习,CityFM 构建了一个多模态的预训练基础模型,用于处理地理空间数据和回答城市相关问题,并在道路、建筑和区域级别的任务上获得了优秀的性能。
- Chatmap:大型语言模型与地图数据的交互
利用相对较小规模(10 亿参数)的大型语言模型和相对较小的人工数据集精细调整,为 OpenStreetMap 数据提供了语言接口,以查询城市区域的属性,并探索人工智能适应性和生成能力在这一领域的早期应用潜力。
- 基于知识增强去噪扩散的城市流动生成建模
通过扩散模型生成没有历史流量数据的区域的动态城市流量,使用城市知识图和增强的扩散模型进行建模,并且通过实验证明其优越性和适用性。
- STint:自标注时序插值的地理数据
我们提出了一种无监督的时间插值技术,不依赖于光流等运动信息,通过自监督技术中的双循环一致性约束,使模型自动生成中间帧,从而在地理空间领域中获得更好的泛化性能。
- 评估大型语言模型在几何和空间关系的文本描述中的有效性
研究使用大型语言模型(LLMs)对几何形状及其空间关系进行表示的能力,并使用 GPT-2 和 BERT 等 LLMs 对几何形状的文本(WKT)格式进行编码,然后将其嵌入分类器和回归器中评估 LLMs 生成的嵌入表示对几何属性的效果。实验证 - 可持续的棕榈树种植:利用物联网和多模态数据早期检测和映射红棕象
该论文提出了一种利用先进技术实现可持续棕榈树耕种的创新方法,该方法结合了计算机视觉、深度学习、物联网和地理空间数据等技术,以有效检测和分类红棕榈象侵染的棕榈树,并利用地理空间数据制作完整的分布图,为高效监控和有针对性的管理策略制定提供方便。
- 地理空间数据的神经网络
本文提出一种新的神经网络估计算法 NN-GLS,利用广义最小二乘(GLS)明确地考虑了空间协方差,从而实现非线性均值,并使用克里金法对新位置进行预测。 作者证明了 NN-GLS 对于不规则的空间相关数据过程是一致的,同时将该算法演示在模拟和