Dec, 2023
具有统计质量保证的调整数据合成
Conformalised data synthesis with statistical quality guarantees
Julia A. Meister, Khuong An Nguyen
TL;DR通过引入一种基于置信度的数据合成算法,该算法通过对 Conformal Prediction 框架进行新的扩展,为模型输出提供统计置信度保证,并通过理论证明和对五个基准数据集的广泛实证评估来支持我们的算法。在面对低样本数、类别不均衡、不可分性和隐私敏感数据等多样困难特征的数据集挑战时,我们的算法在所有试验中都至少与原始数据表现相当,并在很多情况下可以将深度学习性能提升高达 65% 的 F1-score。