高维数据的差分隐私低维表示
本文探讨了不同 ially private PCA 方法的理论和实证性能,并提出了一种明确优化输出效用的新方法。我们发现其样本复杂度与现有程序的不同之处在于其与数据维度的缩放,而且在实际数据中,该方法与现有方法相比具有较大的性能差距。
Jul, 2012
我们采用差分隐私的框架研究了敏感数据分析的方法,通过将均匀采样步骤替换为私有分布估计器,我们改进了 Boedihardjo 等人工作的算法,并提供了离散和连续分布的计算保证,适用于多种统计任务。
May, 2024
提出了基于空间划分技术的差分隐私合成数据生成算法,可以保护数据隐私并生成与原始数据类似的数据,具有可解释性、透明性和可扩展性,并且在实验中表现出相比之前方法更优的效果。
Jun, 2023
在线差分隐私合成数据生成算法,针对数据流和无限时间范围内的超立方体数据,通过在线算法在每个时间 t 生成差分隐私合成数据集,实现在 1-Wasserstein 距离下的近似最优精确度约束。
Feb, 2024
本文探讨了使用具有随机性生成模型的方法来实现隐私保护数据生成,通过将深度模型的连续模数限制在适当的范围内以获得隐私保护,并实验证明了其有效性。
Apr, 2023
本文研究了一种简单的乘法数据库转换方法,它可以利用随机线性或仿射变换对数据进行压缩,从而显著降低数据记录的数量,并保持原始输入变量的数量。通过差分隐私(Dwork 06)概念,本文提供了一个分析框架,旨在表明,尽管实现差分隐私保证存在一般的困难,但可以公开用于一些常见的统计学习应用的合成数据。这包括针对高维稀疏回归(Zhou et al. 07)、主成分分析(PCA)和基于初始数据协方差的其他统计测量(Liu et al. 06)
Jan, 2009
在这项工作中,我们在两种不同类型的输入数据的奇异值间隙下,对私有子空间估计的问题进行了数学建模,并证明了两种情况下的新的上下界。特别是,我们的结果确定了在估计子空间时所需的点数与维度无关的间隙类型。
Feb, 2024
本文提出了 PrivSyn,第一个可以处理普通数据集(具有 100 个属性和域大小 $>2^{500}$)的自动合成数据生成方法,并在多个数据集上进行了广泛的评估,以展示我们的方法的性能。
Dec, 2020