differential privacy has recently emerged as the de facto standard for
private data release. This makes it possible to provide strong theoretical
guarantees on the privacy and utility of released data. While it is well-known
how to release data based on counts and simple functions unde
本文研究了一种简单的乘法数据库转换方法,它可以利用随机线性或仿射变换对数据进行压缩,从而显著降低数据记录的数量,并保持原始输入变量的数量。通过差分隐私(Dwork 06)概念,本文提供了一个分析框架,旨在表明,尽管实现差分隐私保证存在一般的困难,但可以公开用于一些常见的统计学习应用的合成数据。这包括针对高维稀疏回归(Zhou et al. 07)、主成分分析(PCA)和基于初始数据协方差的其他统计测量(Liu et al. 06)