基于图的多模态框架预测城区升级
本文提出了一种使用深度学习和机器视觉技术从 Google Street View 车辆在美国 200 个城市的街道场景中获取汽车数量信息,进而估计美国社会经济趋势和社会人口统计的方法,结果表明自动化系统可以有效补充劳动密集型方法,并具有实时感。
Feb, 2017
提出一种基于知识图谱(KG)以及知识注入对比学习(KnowCL)模型,能够有效地促进城市图像的表征学习和预测,并结合卫星和街景影像进行可持续发展目标的预测,相较基线模型预测精度有超过30%的提高。
Feb, 2023
利用基于深度学习的计算机视觉方法,该研究使用2008年至2021年间的1500万街道图像来测量伦敦的变化,成功地识别了住房供应的变化,为城市规划和政策决策提供及时信息,以建设更宜居、公平和可持续发展的城市。
Sep, 2023
通过高分辨率航拍图像,利用监督卷积神经网络和基于视觉词袋的半监督聚类方法,从公开可获取的城市图像准确估计美国各地区的人口密度、家庭收入中位数和教育水平,并开拓用于地理概括和无需标记数据的细粒度信息估计的新的半监督方法。
Sep, 2023
该论文通过生成对抗网络(GANs)将视觉方面应用于社会过程的研究,通过训练StyleGAN2模型,连接照片数据点与多个贫困指标的元数据,根据这些因素调整合成新图片,研究描述伦敦贫困和富裕地区的视觉差异。
Dec, 2023
计算机科学场景理解中存在社会经济偏见,建议采用更具包容性和代表性的训练数据集,以减少偏见并确保计算机视觉技术的公平性和更均等的社会受益。
Jan, 2024
通过我们的研究,我们引入了一种基于图形的物理感知深度学习框架,揭示了城市社区中固有的错综复杂的重叠性质。通过对美国明尼苏达州双子城都市区(TCMA)的个体移动电话定位数据的分析,我们的研究发现,95.7%的城市功能复杂性源于工作日社区结构的重叠。值得注意的是,我们的研究不仅量化了这些重叠,还揭示了它们与收入和种族指标之间引人注目的相关性,揭示了美国城市中复杂的隔离模式。作为首次阐明城市社区重叠本质的研究,这项工作提供了一种独特的地理空间视角,突出了城市内社会经济动态的微妙相互作用。
Jan, 2024
我们在本文中提出了一种新颖的视觉-语言预训练模型(UrbanVLP),该模型能够无缝地整合来自宏观(卫星)和微观(街景)层面的多粒度信息,克服了先前预训练模型的局限性,提高了城市规划中的可解释性。我们的UrbanVLP模型还引入了自动生成文字描述和校准,通过生成高质量的城市图像描述,提升了在下游应用中的可解释性。大量的实验验证了UrbanVLP在六个社会经济任务上的卓越性能,我们还部署了一个网络平台验证其实用性。
Mar, 2024
利用变分自编码器(VAE)构建深度生成模型,生成具备一致变量相关性、家庭-个体和个体-个体关系、地理分布等特征的合成人口数据集。在美国Delaware州和North Carolina州的应用中,该方法显示了生成真实家庭-个体记录和精确描述人口统计数据的潜力,验证了方法的可迁移性。
Jun, 2024
通过构建街景和遥感图像的对比样本对,并提取文字嵌入中的语义信息,利用跨模态的注意力融合模块,引入多语义对比学习框架(MuseCL)以得到精准的城市区域剖析和经济预测,实验结果表明MuseCL明显优于其他基线模型,准确度平均提高10%。
Jun, 2024