本地隐私 k-Means 聚类

Jul, 2019

Locally Private k-Means Clustering

Uri Stemmer

TL;DR该研究设计了一种新的算法，用于处理欧几里得 k - 均值问题的差分隐私，通过本地模型，可以大幅降低加性误差，同时保持乘性误差不变。

Abstract

We design a new algorithm for the Euclidean $k$-means problem that operates in the local model of differential privacy. Unlike in the non-private literature, differentially private algorithms for the $k$-means ob

euclidean k-means differential privacy additive error multiplicative error local model

发现论文，激发创造

带有恒定乘性误差的差分隐私 k 均值算法

本研究针对欧几里得 k 均值问题，设计了新的差分隐私算法，其在中心模型和本地模型中均获得了显著提高的误差保证，并且还能计算私有 corsets 来处理 k 均值聚类问题。

Apr, 2018

利用指数机制和最大覆盖实现差分隐私的 $k$- 均值聚类

介绍了一种新的差分隐私算法，该算法通过将问题转化为基于网格的最大覆盖问题的一系列实例，实现了较低的加性误差并保持恒定的乘性误差，在 $k$-means 聚类问题上取得了更好的实验效果。

Sep, 2020

连续观察下的聚类差分隐私

我们考虑在 $ R^d $ 中进行隐私数据集聚类的问题

Jul, 2023

一轮局部隐私 k 均值

本文提出了一种算法，用于在差分隐私（DP）的一轮（也称非交互式）本地模型中进行 k 均值聚类，该算法实现的逼近比接近于最佳非私有逼近算法，改进了以前已知的仅保证大（常数）逼近比率的算法。此外，这是第一个仅需要一轮本地 DP 模型通信的 k 均值常数逼近算法，积极地解决了 Stemmer（SODA 2020）提出的一个开放性问题。我们的算法框架非常灵活；我们通过展示在（一轮）洗牌 DP 模型中也会产生类似于最优解的逼近算法来证明这一点。

Apr, 2021

差分隐私聚类：紧密逼近比率

本论文研究了不同 ially private clustering 任务，为 Euclidean DensestBall、1-Cluster、k-means 和 k-median 等基本聚类问题提供了有效的差分隐私算法，同时只产生小的附加误差，从而实现了与任何非私有算法可以获得的近似比例基本相同的近似比例。这改进了现有的仅实现某些大常数逼近因子的有效算法。我们的结果还暗示了改进的 Sample and Aggregate 隐私框架算法。此外，我们展示了在适度的维数下，可以利用我们的 1-Cluster 算法中使用的工具来获得更快的 ClosestPair 量子算法。

Aug, 2020

数据流中的差分隐私聚类

论文提出了不同隐私性水平的 k-means 和 k-median 流式聚类算法，采用核心集算法作为黑盒子并使用多项式空间达到恒定乘性错误和多项式加性错误。

Jul, 2023

基于分层分离树的可扩展差分隐私聚类

通过利用树嵌入和标准的降维技术，我们提出了一种高效易实现的算法，能够解决 $k$- 中位数和 $k$- 均值的私有聚类问题，具有很好的时间和空间复杂度，适用于大规模分布式计算环境，并有可观的隐私保障.

Jun, 2022

基于原始对偶算法的 k-Means 和欧几里得 k-Median 的更好保证

该研究采用原始 - 对偶算法来解决 $k$-means 聚类问题，在满足集群数量限制的同时得到了 6.357 - 近似比的效果，并在欧几里得度量中解决了 $k$-median 的问题。

Dec, 2016

差分隐私 $k$- 均值聚类

本研究比较交互式和非交互式方法在差分隐私数据分析中的权衡，并提出了一种混合方法。通过 $k$-means 聚类作为一个例子，该方法首先使用非交互式机制发布数据集的摘要，然后使用标准 $k$-means 聚类算法学习聚类中心，最后使用交互式方法来进一步改进这些聚类中心。我们分析了交互式和非交互式方法的误差行为，并使用这种分析来决定如何分配隐私预算，大量实验结果支持我们的分析，并证明我们方法的有效性。

Apr, 2015

FastLloyd: 基于差分隐私的联邦式、准确、安全、可调整的 $k$-Means 聚类

在水平联邦环境中，我们研究了隐私保护的 k-means 聚类问题，并通过综合差分隐私和安全计算的方法提出了一个更快速、更加隐私安全和更准确的设计。

May, 2024