Apr, 2019

SynC: 一种使用高斯 Copula 生成合成人口的统一框架

TL;DR本研究提出了一个名为 SynC (Synthetic Population via Gaussian Copula) 的多阶段框架,以从聚合数据源中生成个人级数据,并证明其价值不仅是特征工程工具,而且在收集困难的情况下,还可以作为一种收集数据的替代方法。通过两个真实数据集,本研究展示了其功能,并发布了易于使用的框架实现,并确保该方法可以扩展到生产级别并可以轻松集成新数据。