Apr, 2015

差分隐私 $k$- 均值聚类

TL;DR本研究比较交互式和非交互式方法在差分隐私数据分析中的权衡,并提出了一种混合方法。通过 $k$-means 聚类作为一个例子,该方法首先使用非交互式机制发布数据集的摘要,然后使用标准 $k$-means 聚类算法学习聚类中心,最后使用交互式方法来进一步改进这些聚类中心。我们分析了交互式和非交互式方法的误差行为,并使用这种分析来决定如何分配隐私预算,大量实验结果支持我们的分析,并证明我们方法的有效性。