KDDJul, 2018

生成合理的医疗记录合成数据集

TL;DR通过对患者数据集进行聚类,我们提出了一种新方法来生成二进制数据集,该方法不同于 Generative adversarial networks(GANs),生成的模型易于解释,且通过比较实际应用数据集的多个参数得出的结果表明,该方法生成的人造数据集在多个指标上比现有方法更为逼真。