Feb, 2024

私密统计推断的重采样方法

TL;DR通过构建隐私差分的置信区间,我们提出了两种非参数私有化自举方法,可以在数据的多个分区上私下计算多个 “小” 自举结果的中位数,并给出了对生成置信区间的渐近界限的错误率。对于固定的差分隐私参数 ε,我们的方法在样本量 n 中与非私有自举方法的错误率相似,只有对数因子的差异。我们通过真实数据和合成数据对我们方法的均值估计、中位数估计和逻辑回归的性能进行了实证验证。我们的方法在提供相似的覆盖准确性的同时,相较以前的方法提供了明显更短的(约 10 倍)置信区间。