基于图的多模态框架预测城区升级

Dec, 2023

基于图的多模态框架预测城区升级

A graph-based multimodal framework to predict gentrification

Javad Eshtiyagh, Baotong Zhang, Yujing Sun, Linhui Wu, Zhao Wang

TL;DR提出一种基于城市地块和重要设施的图形多模态深度学习框架，用于预测城市更新，能成功预测人口普查地块级别的城市更新，并发现学校和城市更新之间的强关系。

Abstract

gentrification--the transformation of a low-income urban area caused by the influx of affluent residents--has many revitalizing benefits. However, it also poses extremely concerning challenges to low-income residents

发现论文，激发创造

使用深度学习和 Google 街景视图估计美国人口的人口构成

本文提出了一种使用深度学习和机器视觉技术从 Google Street View 车辆在美国 200 个城市的街道场景中获取汽车数量信息，进而估计美国社会经济趋势和社会人口统计的方法，结果表明自动化系统可以有效补充劳动密集型方法，并具有实时感。

Feb, 2017

基于知识注入的对比学习用于城市图像的社会经济预测

提出一种基于知识图谱(KG)以及知识注入对比学习(KnowCL)模型，能够有效地促进城市图像的表征学习和预测，并结合卫星和街景影像进行可持续发展目标的预测，相较基线模型预测精度有超过30％的提高。

Feb, 2023

自我监督学习揭示了城市住房的变化——从街景图像视角

利用基于深度学习的计算机视觉方法，该研究使用2008年至2021年间的1500万街道图像来测量伦敦的变化，成功地识别了住房供应的变化，为城市规划和政策决策提供及时信息，以建设更宜居、公平和可持续发展的城市。

Sep, 2023

尺度下的细粒度估计近邻社区福祉：基于高分辨率正射影像和混合学习

通过高分辨率航拍图像，利用监督卷积神经网络和基于视觉词袋的半监督聚类方法，从公开可获取的城市图像准确估计美国各地区的人口密度、家庭收入中位数和教育水平，并开拓用于地理概括和无需标记数据的细粒度信息估计的新的半监督方法。

Sep, 2023

基于剥夺指标的 StyleGAN2 街景图像合成的可视化抽象社会过程的生成模型

该论文通过生成对抗网络（GANs）将视觉方面应用于社会过程的研究，通过训练StyleGAN2模型，连接照片数据点与多个贫困指标的元数据，根据这些因素调整合成新图片，研究描述伦敦贫困和富裕地区的视觉差异。

Dec, 2023

场景识别中的数字鸿沟：揭示深度学习系统中的社会经济偏见

计算机科学场景理解中存在社会经济偏见，建议采用更具包容性和代表性的训练数据集，以减少偏见并确保计算机视觉技术的公平性和更均等的社会受益。

Jan, 2024

揭示城市中重叠社群的本质

通过我们的研究，我们引入了一种基于图形的物理感知深度学习框架，揭示了城市社区中固有的错综复杂的重叠性质。通过对美国明尼苏达州双子城都市区（TCMA）的个体移动电话定位数据的分析，我们的研究发现，95.7%的城市功能复杂性源于工作日社区结构的重叠。值得注意的是，我们的研究不仅量化了这些重叠，还揭示了它们与收入和种族指标之间引人注目的相关性，揭示了美国城市中复杂的隔离模式。作为首次阐明城市社区重叠本质的研究，这项工作提供了一种独特的地理空间视角，突出了城市内社会经济动态的微妙相互作用。

Jan, 2024

UrbanVLP：城市指标预测的多粒度视觉语言预训练基础模型

我们在本文中提出了一种新颖的视觉-语言预训练模型（UrbanVLP），该模型能够无缝地整合来自宏观（卫星）和微观（街景）层面的多粒度信息，克服了先前预训练模型的局限性，提高了城市规划中的可解释性。我们的UrbanVLP模型还引入了自动生成文字描述和校准，通过生成高质量的城市图像描述，提升了在下游应用中的可解释性。大量的实验验证了UrbanVLP在六个社会经济任务上的卓越性能，我们还部署了一个网络平台验证其实用性。

Mar, 2024

联合家庭和个体人口合成的深度生成框架

利用变分自编码器（VAE）构建深度生成模型，生成具备一致变量相关性、家庭-个体和个体-个体关系、地理分布等特征的合成人口数据集。在美国Delaware州和North Carolina州的应用中，该方法显示了生成真实家庭-个体记录和精确描述人口统计数据的潜力，验证了方法的可迁移性。

Jun, 2024

MuseCL: 基于多语义对比学习预测城市社会经济指标

通过构建街景和遥感图像的对比样本对，并提取文字嵌入中的语义信息，利用跨模态的注意力融合模块，引入多语义对比学习框架(MuseCL)以得到精准的城市区域剖析和经济预测，实验结果表明MuseCL明显优于其他基线模型，准确度平均提高10%。

Jun, 2024