本地隐私 k-Means 聚类
本研究针对欧几里得 k 均值问题,设计了新的差分隐私算法,其在中心模型和本地模型中均获得了显著提高的误差保证,并且还能计算私有 corsets 来处理 k 均值聚类问题。
Apr, 2018
介绍了一种新的差分隐私算法,该算法通过将问题转化为基于网格的最大覆盖问题的一系列实例,实现了较低的加性误差并保持恒定的乘性误差,在 $k$-means 聚类问题上取得了更好的实验效果。
Sep, 2020
本文提出了一种算法,用于在差分隐私(DP)的一轮(也称非交互式)本地模型中进行 k 均值聚类,该算法实现的逼近比接近于最佳非私有逼近算法,改进了以前已知的仅保证大(常数)逼近比率的算法。此外,这是第一个仅需要一轮本地 DP 模型通信的 k 均值常数逼近算法,积极地解决了 Stemmer(SODA 2020)提出的一个开放性问题。我们的算法框架非常灵活;我们通过展示在(一轮)洗牌 DP 模型中也会产生类似于最优解的逼近算法来证明这一点。
Apr, 2021
本论文研究了不同 ially private clustering 任务,为 Euclidean DensestBall、1-Cluster、k-means 和 k-median 等基本聚类问题提供了有效的差分隐私算法,同时只产生小的附加误差,从而实现了与任何非私有算法可以获得的近似比例基本相同的近似比例。这改进了现有的仅实现某些大常数逼近因子的有效算法。我们的结果还暗示了改进的 Sample and Aggregate 隐私框架算法。此外,我们展示了在适度的维数下,可以利用我们的 1-Cluster 算法中使用的工具来获得更快的 ClosestPair 量子算法。
Aug, 2020
通过利用树嵌入和标准的降维技术,我们提出了一种高效易实现的算法,能够解决 $k$- 中位数和 $k$- 均值的私有聚类问题,具有很好的时间和空间复杂度,适用于大规模分布式计算环境,并有可观的隐私保障.
Jun, 2022
该研究采用原始 - 对偶算法来解决 $k$-means 聚类问题,在满足集群数量限制的同时得到了 6.357 - 近似比的效果,并在欧几里得度量中解决了 $k$-median 的问题。
Dec, 2016
本研究比较交互式和非交互式方法在差分隐私数据分析中的权衡,并提出了一种混合方法。通过 $k$-means 聚类作为一个例子,该方法首先使用非交互式机制发布数据集的摘要,然后使用标准 $k$-means 聚类算法学习聚类中心,最后使用交互式方法来进一步改进这些聚类中心。我们分析了交互式和非交互式方法的误差行为,并使用这种分析来决定如何分配隐私预算,大量实验结果支持我们的分析,并证明我们方法的有效性。
Apr, 2015
在水平联邦环境中,我们研究了隐私保护的 k-means 聚类问题,并通过综合差分隐私和安全计算的方法提出了一个更快速、更加隐私安全和更准确的设计。
May, 2024