本文研究的是隐私保护聚类算法,提出了一个依据难易程度来组合本来不带保护性质的聚类算法和隐私保护结果的框架,并在高斯混合数据和 $k$-means 算法中实现了样本复杂度较小的聚类效果进行了实证评估。
Dec, 2021
使用差分隐私的新算法定位少数点的集群,并可用于私人数据探索、聚类和去除异常值,同时大大放宽了样本和聚合技术的需求,可将非私有的分析编译为保护差分隐私的分析。
Apr, 2016
研究了针对良好聚类图中恢复聚类的差分隐私算法,这些图的顶点集可以被划分为少量集合,每个集合引导高内部电导和小外部电导的子图,这些图在谱聚类的理论分析中具有普遍应用。提供了一种针对这种图特别定制的高效(ε,δ)差分隐私算法。该算法灵感来自 Chen 等人最近的工作,他们在图仅包含两个几乎平衡聚类的情况下开发了差分隐私算法。我们的算法适用于具有 k 个几乎平衡聚类的良好聚类图,误分类比率接近最佳非隐私算法。通过在已知的地面真实聚类的数据集上进行实验评估,证实了我们算法的能力。还表明任何(纯的)ε- 差分隐私算法将导致显著的误差。
Mar, 2024
本论文研究了不同 ially private clustering 任务,为 Euclidean DensestBall、1-Cluster、k-means 和 k-median 等基本聚类问题提供了有效的差分隐私算法,同时只产生小的附加误差,从而实现了与任何非私有算法可以获得的近似比例基本相同的近似比例。这改进了现有的仅实现某些大常数逼近因子的有效算法。我们的结果还暗示了改进的 Sample and Aggregate 隐私框架算法。此外,我们展示了在适度的维数下,可以利用我们的 1-Cluster 算法中使用的工具来获得更快的 ClosestPair 量子算法。
Aug, 2020
本文提出了一种针对图中任意形状节点簇的差分隐私聚类算法,该算法仅使用在权重差分隐私约束下释放的近似最小生成树作为输入,并通过最优剪切方法从中成功恢复底层的非凸聚类分区。与现有方法不同,我们的算法在理论上得到了很好的支持,并且实验证实了我们的理论发现。
Mar, 2018
基于随机实验估计因果效应只有在参与者同意透露潜在敏感回应的情况下才可行。我们提出了一种新的差分隐私机制 “Cluster-DP”,通过利用数据的任何给定的聚类结构来实现更强的隐私保证和更低的方差损失,同时仍然允许因果效应的估计。
Aug, 2023
通过利用树嵌入和标准的降维技术,我们提出了一种高效易实现的算法,能够解决 $k$- 中位数和 $k$- 均值的私有聚类问题,具有很好的时间和空间复杂度,适用于大规模分布式计算环境,并有可观的隐私保障.
Jun, 2022
我们考虑在 $ R^d $ 中进行隐私数据集聚类的问题
Jul, 2023
论文提出了不同隐私性水平的 k-means 和 k-median 流式聚类算法,采用核心集算法作为黑盒子并使用多项式空间达到恒定乘性错误和多项式加性错误。
本文首次尝试以差分隐私为基础的拓扑数据分析,产生了近乎最优的私有持久性图。研究表明,使用 $L^1$-DTM 持久性图在灵敏度方面的表现更佳,并提出了使用指数机制进行隐私保护的方案。通过模拟和实验数据验证,证明了提出的隐私机制近乎最优的准确性。
May, 2023