带有恒定乘性误差的差分隐私 k 均值算法

Apr, 2018

带有恒定乘性误差的差分隐私 k 均值算法

Differentially Private k-Means with Constant Multiplicative Error

Haim Kaplan, Uri Stemmer

TL;DR本研究针对欧几里得 k 均值问题，设计了新的差分隐私算法，其在中心模型和本地模型中均获得了显著提高的误差保证，并且还能计算私有 corsets 来处理 k 均值聚类问题。

Abstract

We design new differentially private algorithms for the Euclidean k-means problem, both in the centralized model and in the local model of

differentially private algorithms euclidean k-means problem centralized model local model private corsets

发现论文，激发创造

本地隐私 k-Means 聚类

该研究设计了一种新的算法，用于处理欧几里得 k - 均值问题的差分隐私，通过本地模型，可以大幅降低加性误差，同时保持乘性误差不变。

Jul, 2019

差分隐私聚类：紧密逼近比率

本论文研究了不同 ially private clustering 任务，为 Euclidean DensestBall、1-Cluster、k-means 和 k-median 等基本聚类问题提供了有效的差分隐私算法，同时只产生小的附加误差，从而实现了与任何非私有算法可以获得的近似比例基本相同的近似比例。这改进了现有的仅实现某些大常数逼近因子的有效算法。我们的结果还暗示了改进的 Sample and Aggregate 隐私框架算法。此外，我们展示了在适度的维数下，可以利用我们的 1-Cluster 算法中使用的工具来获得更快的 ClosestPair 量子算法。

Aug, 2020

一轮局部隐私 k 均值

本文提出了一种算法，用于在差分隐私（DP）的一轮（也称非交互式）本地模型中进行 k 均值聚类，该算法实现的逼近比接近于最佳非私有逼近算法，改进了以前已知的仅保证大（常数）逼近比率的算法。此外，这是第一个仅需要一轮本地 DP 模型通信的 k 均值常数逼近算法，积极地解决了 Stemmer（SODA 2020）提出的一个开放性问题。我们的算法框架非常灵活；我们通过展示在（一轮）洗牌 DP 模型中也会产生类似于最优解的逼近算法来证明这一点。

Apr, 2021

连续观察下的聚类差分隐私

我们考虑在 $ R^d $ 中进行隐私数据集聚类的问题

Jul, 2023

利用指数机制和最大覆盖实现差分隐私的 $k$- 均值聚类

介绍了一种新的差分隐私算法，该算法通过将问题转化为基于网格的最大覆盖问题的一系列实例，实现了较低的加性误差并保持恒定的乘性误差，在 $k$-means 聚类问题上取得了更好的实验效果。

Sep, 2020

数据流中的差分隐私聚类

论文提出了不同隐私性水平的 k-means 和 k-median 流式聚类算法，采用核心集算法作为黑盒子并使用多项式空间达到恒定乘性错误和多项式加性错误。

Jul, 2023

使旧事焕新：差分隐私聚类的统一算法

20 年前的算法经过轻微修改，适用于各种隐私模型，匹配几乎所有已知结果，改进了一些结果并扩展到新的隐私模型，即连续观测环境。

Jun, 2024

易实例的不同 ially-Private 聚类

本文研究的是隐私保护聚类算法，提出了一个依据难易程度来组合本来不带保护性质的聚类算法和隐私保护结果的框架，并在高斯混合数据和 $k$-means 算法中实现了样本复杂度较小的聚类效果进行了实证评估。

Dec, 2021

具有稳定性假设的差分隐私聚类算法

本文研究了在输入稳定性假设下的差分隐私聚类问题，提出了一种简单的算法，分析了其在 Wasserstein 距离和 k-means 代价等方面的效用，可直接应用于 “好” 的 k - 中位数实例和本地模型的差分隐私。

Jun, 2021

聚类中的数据稳定性：深入研究

本文考虑了 Bilu 和 Linial（2010）提出的模型，研究了最佳聚类不发生变化的问题，我们发现即使问题是 NP 困难的，有时候也可能获得有效算法，这些算法对于特定的多项式扰动是鲁棒的。同时，我们证明了该区间内的乘法鲁棒性参数可能太强，以至于聚类问题变得微不足道，只有一个较窄的区间是有趣的。

Jul, 2011