研究评估了标准的限制分层技术,发现它们不能提高对美国县级人口健康状况统计数据的预测准确性;该研究提出了三种方法组成的鲁棒后分层技术,显著提高了预测精度。
Nov, 2019
本研究提出了基于条件分数扩散模型的时间序列插值方法,相较于现有概率插值方法以及现有确定性插值方法,该方法在医疗和环境数据方面表现优异,可以减少5-20%的误差,并可在时间序列内插值和概率预测中应用,具有广泛的应用前景。
Jul, 2021
本文提出了一种用于Tabular数据的基于条件分数的扩散模型方法(TabCSDI),并研究了热点问题中的三种处理技术。实验结果表明与现有方法相比,TabCSDI是有效的,同时也强调了分类嵌入技术的重要性。
Oct, 2022
该研究利用卫星图像和在线群众采集与社交媒体数据,运用机器学习方法,建立了可预测多个具有地理聚集特征的人口聚居地财富平均数和标准差的模型,并在塞拉利昂和乌干达进行了验证和性能比较,揭示元数据对农村区域财富预测有更好的表现。该方法不仅能恢复本地财富的平均数和变异性,还能捕捉它们之间的正相关性,具有一定的可迁移性和可解释性。
Feb, 2023
这篇研究主要讲述了如何将非线性流形学习方法——Diffusion Maps扩展到函数数据,并在不同的仿真和实例中将其行为与函数PCA进行比较,以便进行功能数据分析和降维。
Apr, 2023
本文通过使用十个国家的调查与卫星数据,研究城乡界限上的贫困地图建立中的不平等现象、预测误差中的系统性偏差以及公平性问题,展示了这些现象如何影响基于预测地图的政策的有效性。本文的发现强调了在使用卫星贫困地图做出现实世界政策决策之前进行仔细的误差和偏差分析的重要性。
May, 2023
该论文通过生成对抗网络(GANs)将视觉方面应用于社会过程的研究,通过训练StyleGAN2模型,连接照片数据点与多个贫困指标的元数据,根据这些因素调整合成新图片,研究描述伦敦贫困和富裕地区的视觉差异。
Dec, 2023
运用社交媒体和统计模型,本研究分析了纽约市的推文,发现性别、族裔、邻里交通等因素会影响个人对交通可达性的认知,而亚洲族裔和空气污染也与社会经济不平等有关。然而,对于弱势群体而言,缺乏网络可访问性可能是不善于表达交通可达性问题的原因之一。
Jan, 2024
本篇综述论文全面而彻底地回顾了扩散模型在时间序列和时空数据分析中的应用,通过按照模型类别、任务类型、数据模态和实际应用领域进行分类,提供了对这些模型分析和生成数据的基本了解,旨在为研究人员和从业者提供一个全面的扩散模型应用的理解,以解决传统挑战并在扩散模型框架下探索创新解决方案。
Apr, 2024
本研究解决了多元时间序列插补中未考虑潜在低维分布的问题,并提出了一种新的潜在空间评分扩散模型(LSSDM)。该模型通过无监督学习重建缺失数据的粗略值,并利用条件扩散模型生成高精度的插补值,从而在插补性能和不确定性分析方面优于现有方法。
Sep, 2024