可解释的 k-Medians 和 k-Means 的近似最优算法
本文提出了一种使用决策树对数据集进行聚类的算法,并探讨了该方法对 k-means 和 k-medians 目标函数的适用性。作者证明了常见的自顶向下决策树算法可能会导致成本任意大的聚类结果,但设计了一种有效的方法使用具有 k 个叶子的树生成可解释的聚类,并对于两个中心点的情况,仅需要一个阈值切割即可实现常数近似。
Feb, 2020
提出了一个算法,用于在 $k$-medians 目标和 $k$-means 目标下输出可解释的聚类,与最佳聚类最多相差 $O (\log^2 k)$ 和 $O (k\log^2 k)$ 的因子,算法时间为 $O (dk\log^2 k)$ 。
Jun, 2021
介绍了一种可解释性聚类方法,算法通过应用决策树将数据划分为轴平行超平面聚类,使得聚类边界简单,同时保证聚类代价函数的可解释性约束,聚类的代价至多是比不考虑可解释性约束的情况最小代价增加 $k^{1-2/d}$ 倍,与其他方法的代价上界取最小值可得到 $k^{1-2/d} polylog (k)$ 倍,此为 $k,d ≥ 2$ 下的最优代价上界。
Jun, 2021
通过利用树嵌入和标准的降维技术,我们提出了一种高效易实现的算法,能够解决 $k$- 中位数和 $k$- 均值的私有聚类问题,具有很好的时间和空间复杂度,适用于大规模分布式计算环境,并有可观的隐私保障.
Jun, 2022
本文研究可解释 K-means 和 K-median 聚类问题,证明了在欧几里得平面上,解释深度降低会导致聚类成本的无界损失,并将其扩展到 K-center 目标。
May, 2023
我们研究了基于解释和准确性之间的平衡的 $k$-means 聚类算法,设计了一种新的解释性 $k$-means 聚类算法 ExKMC,用于有效地将数据集划分为 $k'$ 个叶子节点,并以 $k$ 个簇之一的形式对叶子节点进行标记。经实验验证,ExKMC 的聚类效果优于标准的决策树方法和其他解释性聚类算法。
Jun, 2020
通过投影到随机的 O (log (k/ ε) / ε²) 维子空间上,可以近似保持欧几里得 k-means 或 k-medians 聚类的最优解成本,并且适用于任何满足温和的子高斯尾条件的维度缩减映射,其维数几乎是最优的。此外,该结果适用于所有权重的欧几里得 k - 聚类。
Nov, 2018
该研究采用原始 - 对偶算法来解决 $k$-means 聚类问题,在满足集群数量限制的同时得到了 6.357 - 近似比的效果,并在欧几里得度量中解决了 $k$-median 的问题。
Dec, 2016
本文研究了基于 k-median 目标函数的聚类问题,提出了一种称为连续采样的简单但有效的采样技术,并使用该技术开发了一个可在 O(nk)时间内运行的算法来解决 k-median 问题。
Dec, 2012