社会经济剥夺分析：扩散图

Dec, 2023

Socio-Economic Deprivation Analysis: Diffusion Maps

June Moh Goo

TL;DR本研究报告提出了一个使用普查数据预测城市中最贫困地区位置的模型，通过降低维度和寻找模式的新算法——扩散映射，将高维度的普查数据进行简化，利用定义扩散映射的拉普拉斯矩阵的特征向量来定义特征，而对应最小特征值的特征向量指示了特定人口特征；通过与认可的度量进行比较分析，发现所述维度对于描述Bristol的普查数据中的贫困与否具有较高的预测能力，预测性能表现良好以支持政府资源和资金的分配。

Abstract

This report proposes a model to predict the location of the most deprived areas in a city using data from the census. A census data is very high dimensional and needs to be simplified. We use a novel algorithm to

发现论文，激发创造

纠正社会人口选择偏误进行社交媒体人口预测

研究评估了标准的限制分层技术，发现它们不能提高对美国县级人口健康状况统计数据的预测准确性；该研究提出了三种方法组成的鲁棒后分层技术，显著提高了预测精度。

Nov, 2019

CSDI: 条件得分扩散模型用于概率时间序列插补

本研究提出了基于条件分数扩散模型的时间序列插值方法，相较于现有概率插值方法以及现有确定性插值方法，该方法在医疗和环境数据方面表现优异，可以减少5-20%的误差，并可在时间序列内插值和概率预测中应用，具有广泛的应用前景。

Jul, 2021

表格数据中的缺失值插值扩散模型

本文提出了一种用于Tabular数据的基于条件分数的扩散模型方法（TabCSDI），并研究了热点问题中的三种处理技术。实验结果表明与现有方法相比，TabCSDI是有效的，同时也强调了分类嵌入技术的重要性。

Oct, 2022

利用多模态数据推断贫困地图解释财富分布

该研究利用卫星图像和在线群众采集与社交媒体数据，运用机器学习方法，建立了可预测多个具有地理聚集特征的人口聚居地财富平均数和标准差的模型，并在塞拉利昂和乌干达进行了验证和性能比较，揭示元数据对农村区域财富预测有更好的表现。该方法不仅能恢复本地财富的平均数和变异性，还能捕捉它们之间的正相关性，具有一定的可迁移性和可解释性。

Feb, 2023

功能性扩散图

这篇研究主要讲述了如何将非线性流形学习方法——Diffusion Maps扩展到函数数据，并在不同的仿真和实例中将其行为与函数PCA进行比较，以便进行功能数据分析和降维。

Apr, 2023

卫星贫困地图中的公平性和代表性：城乡差异及其对下游政策的影响证据

本文通过使用十个国家的调查与卫星数据，研究城乡界限上的贫困地图建立中的不平等现象、预测误差中的系统性偏差以及公平性问题，展示了这些现象如何影响基于预测地图的政策的有效性。本文的发现强调了在使用卫星贫困地图做出现实世界政策决策之前进行仔细的误差和偏差分析的重要性。

May, 2023

基于剥夺指标的 StyleGAN2 街景图像合成的可视化抽象社会过程的生成模型

该论文通过生成对抗网络（GANs）将视觉方面应用于社会过程的研究，通过训练StyleGAN2模型，连接照片数据点与多个贫困指标的元数据，根据这些因素调整合成新图片，研究描述伦敦贫困和富裕地区的视觉差异。

Dec, 2023

利用社交媒体数据识别影响公众对无障碍性、社会经济差异和公共交通态度的因素

运用社交媒体和统计模型，本研究分析了纽约市的推文，发现性别、族裔、邻里交通等因素会影响个人对交通可达性的认知，而亚洲族裔和空气污染也与社会经济不平等有关。然而，对于弱势群体而言，缺乏网络可访问性可能是不善于表达交通可达性问题的原因之一。

Jan, 2024

时序和时空数据扩散模型调查

本篇综述论文全面而彻底地回顾了扩散模型在时间序列和时空数据分析中的应用，通过按照模型类别、任务类型、数据模态和实际应用领域进行分类，提供了对这些模型分析和生成数据的基本了解，旨在为研究人员和从业者提供一个全面的扩散模型应用的理解，以解决传统挑战并在扩散模型框架下探索创新解决方案。

Apr, 2024

基于潜在空间评分的扩散模型用于多元时间序列的概率插补

本研究解决了多元时间序列插补中未考虑潜在低维分布的问题，并提出了一种新的潜在空间评分扩散模型（LSSDM）。该模型通过无监督学习重建缺失数据的粗略值，并利用条件扩散模型生成高精度的插补值，从而在插补性能和不确定性分析方面优于现有方法。

Sep, 2024