用于合成数据生成的 Copula 流
本论文提出了一种基于 copula 模型生成合成数据集的新方法,以生成在边际和联合分布方面类似于真实数据的代理数据。将该方法应用于两个数据集显示出比 SMOTE 和自编码器等其他方法更好的性能。
Mar, 2022
本论文通过引入 copula 和 marginal generative flows (CM 流),解决了深度生成网络中存在的尾部特性建模或外推的问题并提出了上界方法。最终的结果支持了 CM 流的使用。
Jul, 2019
本文提出了使用更加复杂的 Copula 分布来代替高斯基础分布,从而提高归一化流模型的灵活性和稳定性,特别地,在处理重尾分布数据时效果显著提升,并解释了这一改进与所学习流的局部 Lipschitz 稳定性有关。
Jul, 2021
本研究提出了一个名为 SynC (Synthetic Population via Gaussian Copula) 的多阶段框架,以从聚合数据源中生成个人级数据,并证明其价值不仅是特征工程工具,而且在收集困难的情况下,还可以作为一种收集数据的替代方法。通过两个真实数据集,本研究展示了其功能,并发布了易于使用的框架实现,并确保该方法可以扩展到生产级别并可以轻松集成新数据。
Apr, 2019
该论文研究了无监督学习中生成模型的训练方法,提出了一种在对抗网络与似然训练之间进行混合训练的方法,其中使用深度可逆变换来解决概率和逆变换之间的冲突,实现了更好的生成样本和更高的似然性评估。
Jan, 2019
我们提出了一种基于高斯联合分布的特征选择方法,该方法可以在神经网络中进行实例级的特征选择,并捕捉变量之间的相关性。实验结果表明,我们的方法能够准确地捕捉到有意义的相关性。
Aug, 2023
通过引入一种新的剪辑和扰动策略,基于 Renyi 差分隐私监管机制,提出了一种差分隐私条件生成式对抗网络(DP-CGAN)训练框架,用于在保持培训数据隐私的同时提高模型性能,实验结果表明 DP-CGAN 可以通过单一的差分隐私 epsilon 参数在 MNIST 数据集上生成视觉和实验上有前途的结果。
Jan, 2020