该研究设计了一种新的算法,用于处理欧几里得 k - 均值问题的差分隐私,通过本地模型,可以大幅降低加性误差,同时保持乘性误差不变。
Jul, 2019
本论文研究了不同 ially private clustering 任务,为 Euclidean DensestBall、1-Cluster、k-means 和 k-median 等基本聚类问题提供了有效的差分隐私算法,同时只产生小的附加误差,从而实现了与任何非私有算法可以获得的近似比例基本相同的近似比例。这改进了现有的仅实现某些大常数逼近因子的有效算法。我们的结果还暗示了改进的 Sample and Aggregate 隐私框架算法。此外,我们展示了在适度的维数下,可以利用我们的 1-Cluster 算法中使用的工具来获得更快的 ClosestPair 量子算法。
Aug, 2020
本文提出了一种算法,用于在差分隐私(DP)的一轮(也称非交互式)本地模型中进行 k 均值聚类,该算法实现的逼近比接近于最佳非私有逼近算法,改进了以前已知的仅保证大(常数)逼近比率的算法。此外,这是第一个仅需要一轮本地 DP 模型通信的 k 均值常数逼近算法,积极地解决了 Stemmer(SODA 2020)提出的一个开放性问题。我们的算法框架非常灵活;我们通过展示在(一轮)洗牌 DP 模型中也会产生类似于最优解的逼近算法来证明这一点。
Apr, 2021
我们考虑在 $ R^d $ 中进行隐私数据集聚类的问题
Jul, 2023
介绍了一种新的差分隐私算法,该算法通过将问题转化为基于网格的最大覆盖问题的一系列实例,实现了较低的加性误差并保持恒定的乘性误差,在 $k$-means 聚类问题上取得了更好的实验效果。
Sep, 2020
论文提出了不同隐私性水平的 k-means 和 k-median 流式聚类算法,采用核心集算法作为黑盒子并使用多项式空间达到恒定乘性错误和多项式加性错误。
20 年前的算法经过轻微修改,适用于各种隐私模型,匹配几乎所有已知结果,改进了一些结果并扩展到新的隐私模型,即连续观测环境。
Jun, 2024
本文研究的是隐私保护聚类算法,提出了一个依据难易程度来组合本来不带保护性质的聚类算法和隐私保护结果的框架,并在高斯混合数据和 $k$-means 算法中实现了样本复杂度较小的聚类效果进行了实证评估。
Dec, 2021
本文研究了在输入稳定性假设下的差分隐私聚类问题,提出了一种简单的算法,分析了其在 Wasserstein 距离和 k-means 代价等方面的效用,可直接应用于 “好” 的 k - 中位数实例和本地模型的差分隐私。
Jun, 2021
本文考虑了 Bilu 和 Linial(2010)提出的模型,研究了最佳聚类不发生变化的问题,我们发现即使问题是 NP 困难的,有时候也可能获得有效算法,这些算法对于特定的多项式扰动是鲁棒的。同时,我们证明了该区间内的乘法鲁棒性参数可能太强,以至于聚类问题变得微不足道,只有一个较窄的区间是有趣的。
Jul, 2011