交互式聚类的本地算法

Dec, 2013

Local algorithms for interactive clustering

Pranjal Awasthi, Maria-Florina Balcan, Konstantin Voevodski

TL;DR本文研究了基于稳定性假设的交互式聚类算法设计，算法开始于任意初始聚类，只进行每步的局部更改；我们证明在这种约束条件下，仍然可以设计出具有可证明高效和准确聚类能力的算法，并在真实数据上进行了实证。

Abstract

We study the design of interactive clustering algorithms for data sets satisfying natural stability assumptions. Our algorithms start with any initial clustering and only make →

interactive clustering algorithms stability assumptions local changes efficient algorithms real-world data

发现论文，激发创造

欧几里得 k-means 的稳定实例聚类

本文研究在实际应用中，哪些加性扰动稳定性的实例可以设计有效算法，并证明它们能找到最优聚类。我们提出了一种稳定性定义，并设计了算法以证明稳定实例的最优聚类。当实例具有一定的分离性时，我们显示出一种具有证明保证的鲁棒算法，也能容忍异常值。通过研究真实数据集的稳定性，我们补充了这些结果，并展示了我们的算法在这些基准数据集上的表现。

Dec, 2017

分布式聚类与异常检测的实用算法

本文提出了一种基于简要构建的数据摘要的分布式无监督学习算法，对异常点的全局识别有很好的近似保证，并在真实和人工数据上超过了所有基线算法。

May, 2018

寻找密集连接聚类的本地算法

本文研究了一种基于局部算法的图聚类方法，通过引入新的缩减技术来分析多个集合间的相互关系，并在多个实际数据集上通过恢复密集连接簇来展示算法的有效性。

Jun, 2021

大规模图的本地聚类算法及其在近似线性时间图分割中的应用

本文研究了大规模图的本地算法设计并提出了一种本地聚类算法，该算法可在几乎线性的时间内找到较好的簇，并基于该聚类算法提出了一种划分算法，进而设计了求解对称对角占优矩阵中线性系统的近线性算法，还提出了其他相关结果。

Sep, 2008

个体偏好稳定聚类的可扩展算法

本文研究了个体偏好稳定性（IP Stability），该概念捕捉了聚类中的个体公平性和稳定性。在这个设置中，如果每个数据点到其簇的平均距离不超过其到其他簇的平均距离的 α 倍，那么聚类就是 α-IP 稳定的。本文研究了个体偏好稳定聚类的自然局部搜索算法，我们的分析证实了该算法具有 O (log n)-IP 稳定性保证，其中 n 是输入中点的数量。此外，通过改进局部搜索方法，我们展示了该算法运行时间几乎是线性的，即约为 O (nk)。

Mar, 2024

具有稳定性假设的差分隐私聚类算法

本文研究了在输入稳定性假设下的差分隐私聚类问题，提出了一种简单的算法，分析了其在 Wasserstein 距离和 k-means 代价等方面的效用，可直接应用于 “好” 的 k - 中位数实例和本地模型的差分隐私。

Jun, 2021

稀疏随机图上本地算法的限制

本文研究了关于在图上的局部算法。我们证明了局部算法产生的每个独立集都比最大集合要小，而且通过聚类属性，我们强调了在随机图上的局部算法存在局限性。

Apr, 2013

一轮局部隐私 k 均值

本文提出了一种算法，用于在差分隐私（DP）的一轮（也称非交互式）本地模型中进行 k 均值聚类，该算法实现的逼近比接近于最佳非私有逼近算法，改进了以前已知的仅保证大（常数）逼近比率的算法。此外，这是第一个仅需要一轮本地 DP 模型通信的 k 均值常数逼近算法，积极地解决了 Stemmer（SODA 2020）提出的一个开放性问题。我们的算法框架非常灵活；我们通过展示在（一轮）洗牌 DP 模型中也会产生类似于最优解的逼近算法来证明这一点。

Apr, 2021

强健层次聚类

本文提出了一种新的鲁棒的自下而上聚类算法，并展示了在满足一定自然属性且传统算法失效的情况下，该算法可以被用来进行准确的聚类。同时，该算法也被适用于归纳设置，并在合成数据和真实数据集上的实验表明，在存在噪音时，与其他分层算法相比，该算法可以获得更好的表现。

Jan, 2014

聚类的个人偏好稳定性

本文提出了一种基于个体偏好稳定性思想的聚类方法，通过设计多种算法和在不同度量空间的实验验证，实现了具有较高效率和稳定性的聚类。

Jul, 2022