UrbanVLP：城市指标预测的多粒度视觉语言预训练基础模型

Mar, 2024

UrbanVLP：城市指标预测的多粒度视觉语言预训练基础模型

UrbanVLP: A Multi-Granularity Vision-Language Pre-Trained Foundation Model for Urban Indicator Prediction

Xixuan Hao, Wei Chen, Yibo Yan, Siru Zhong, Kun Wang...

TL;DR我们在本文中提出了一种新颖的视觉-语言预训练模型（UrbanVLP），该模型能够无缝地整合来自宏观（卫星）和微观（街景）层面的多粒度信息，克服了先前预训练模型的局限性，提高了城市规划中的可解释性。我们的UrbanVLP模型还引入了自动生成文字描述和校准，通过生成高质量的城市图像描述，提升了在下游应用中的可解释性。大量的实验验证了UrbanVLP在六个社会经济任务上的卓越性能，我们还部署了一个网络平台验证其实用性。

Abstract

urban indicator prediction aims to infer socio-economic metrics in diverse urban landscapes using data-driven methods. However, prevalent pre-trained models, particularly those reliant on satellite imagery, face

发现论文，激发创造

利用卷积网络和卫星图像在大范围内识别城市环境模式

利用遥感技术和深度卷积神经网络，分析大规模卫星图像数据中的城市土地利用模式，并提供数据集以供遥感应用的机器学习研究人员使用。

Apr, 2017

卫星图像轻量级和稳健的经济尺度表征

提出一种名为 READ 的新方法，利用深度神经网络从高分辨率卫星图像中获取任何给定区域的基本空间表示，结合转移学习和嵌入式统计学习显著提取尺寸任意的地区的重要空间特征，在小标签集的情况下，可区分城乡地区的微小差异，预测经济规模且表现最优，为开发中国家提供了潜在利用价值。

Dec, 2019

基于知识注入的对比学习用于城市图像的社会经济预测

提出一种基于知识图谱(KG)以及知识注入对比学习(KnowCL)模型，能够有效地促进城市图像的表征学习和预测，并结合卫星和街景影像进行可持续发展目标的预测，相较基线模型预测精度有超过30％的提高。

Feb, 2023

美国城市长期可持续发展的卫星图像数据集

为支持美国城市可持续发展目标研究，我们利用深度学习模型开发了一个卫星图像数据集，涵盖了五个可持续发展目标和25个指标。该数据集覆盖了美国最多人口的100个城市以及对应的人口普查街区组，时间跨度为2014年至2023年。该数据集将帮助城市决策者和研究人员推进城市中与可持续发展目标相关的研究，尤其是应用卫星图像监测城市中的长期和多尺度可持续发展目标。

Aug, 2023

自我监督学习揭示了城市住房的变化——从街景图像视角

利用基于深度学习的计算机视觉方法，该研究使用2008年至2021年间的1500万街道图像来测量伦敦的变化，成功地识别了住房供应的变化，为城市规划和政策决策提供及时信息，以建设更宜居、公平和可持续发展的城市。

Sep, 2023

尺度下的细粒度估计近邻社区福祉：基于高分辨率正射影像和混合学习

通过高分辨率航拍图像，利用监督卷积神经网络和基于视觉词袋的半监督聚类方法，从公开可获取的城市图像准确估计美国各地区的人口密度、家庭收入中位数和教育水平，并开拓用于地理概括和无需标记数据的细粒度信息估计的新的半监督方法。

Sep, 2023

城市区域概述与大型语言模型相结合

通过引入文本模态，利用大型语言模型（LLMs）的能力，本文介绍了一种集成文本模态于城市影像特征建模的框架UrbanCLIP，并以四个中国主要大都市为例，对三个城市指标进行预测，相较于最先进的方法，平均提升了6.1%的R^2表现。

Oct, 2023

UrbanGPT：时空大型语言模型

基于大型语言模型和空间-时间依赖编码器的UrbanGPT在数据稀缺情况下实现了更全面、准确的空间-时间预测任务，显示了在零样本场景中建立大型语言模型的潜力。

Feb, 2024

MuseCL: 基于多语义对比学习预测城市社会经济指标

通过构建街景和遥感图像的对比样本对，并提取文字嵌入中的语义信息，利用跨模态的注意力融合模块，引入多语义对比学习框架(MuseCL)以得到精准的城市区域剖析和经济预测，实验结果表明MuseCL明显优于其他基线模型，准确度平均提高10%。

Jun, 2024

GeoTransformer：通过地理空间注意机制增强城市预测

本研究解决了城市预测中高维空间表示的有效利用不足的问题。提出了一种新颖的GeoTransformer结构，结合了Transformer架构与地理空间统计先验，通过创新的地理空间注意机制，整合了丰富的城市信息与空间依赖性进行预测。研究表明，GeoTransformer在GDP和共享出行需求预测任务中显著优于现有基线模型，展示了其在城市预测任务中的潜在影响。

Aug, 2024