易实例的不同 ially-Private 聚类
本论文研究了不同 ially private clustering 任务,为 Euclidean DensestBall、1-Cluster、k-means 和 k-median 等基本聚类问题提供了有效的差分隐私算法,同时只产生小的附加误差,从而实现了与任何非私有算法可以获得的近似比例基本相同的近似比例。这改进了现有的仅实现某些大常数逼近因子的有效算法。我们的结果还暗示了改进的 Sample and Aggregate 隐私框架算法。此外,我们展示了在适度的维数下,可以利用我们的 1-Cluster 算法中使用的工具来获得更快的 ClosestPair 量子算法。
Aug, 2020
本研究比较交互式和非交互式方法在差分隐私数据分析中的权衡,并提出了一种混合方法。通过 $k$-means 聚类作为一个例子,该方法首先使用非交互式机制发布数据集的摘要,然后使用标准 $k$-means 聚类算法学习聚类中心,最后使用交互式方法来进一步改进这些聚类中心。我们分析了交互式和非交互式方法的误差行为,并使用这种分析来决定如何分配隐私预算,大量实验结果支持我们的分析,并证明我们方法的有效性。
Apr, 2015
本文研究了在输入稳定性假设下的差分隐私聚类问题,提出了一种简单的算法,分析了其在 Wasserstein 距离和 k-means 代价等方面的效用,可直接应用于 “好” 的 k - 中位数实例和本地模型的差分隐私。
Jun, 2021
通过使用 Morse 理论,构建子高斯簇将复杂簇分布与不同隐私保护保持一定的性能平衡,由于差分隐私子簇是通过现有方法进行获得的,所以所提出的方法几乎不存在额外的隐私损失。实验结果表明,在相同的隐私级别下,我们的方法能够实现更好的聚类性能。
Apr, 2023
基于随机实验估计因果效应只有在参与者同意透露潜在敏感回应的情况下才可行。我们提出了一种新的差分隐私机制 “Cluster-DP”,通过利用数据的任何给定的聚类结构来实现更强的隐私保证和更低的方差损失,同时仍然允许因果效应的估计。
Aug, 2023
该论文研究了 $k$-means 算法的能力,正确地恢复互相分离的簇群。基于常见的簇群定义,考虑了簇内同质性和簇间多样性的要求,并找到了一种特殊情况的互相分离簇群,使得 $k$-means 的代价函数全局最小值与互相分离性一致。通过实验发现各种 $k$-means 品牌实际上无法发现互相分离的簇群,因此提出了一种新的算法,通过重复子抽样选择种子的方式,对 $k$-means++ 进行变体改进,并在任务中胜过 $k$-means 系列中的其他四种算法。
Aug, 2023