可解释聚类中深度减少的不可能性
介绍了一种可解释性聚类方法,算法通过应用决策树将数据划分为轴平行超平面聚类,使得聚类边界简单,同时保证聚类代价函数的可解释性约束,聚类的代价至多是比不考虑可解释性约束的情况最小代价增加 $k^{1-2/d}$ 倍,与其他方法的代价上界取最小值可得到 $k^{1-2/d} polylog (k)$ 倍,此为 $k,d ≥ 2$ 下的最优代价上界。
Jun, 2021
本文提出了一种使用决策树对数据集进行聚类的算法,并探讨了该方法对 k-means 和 k-medians 目标函数的适用性。作者证明了常见的自顶向下决策树算法可能会导致成本任意大的聚类结果,但设计了一种有效的方法使用具有 k 个叶子的树生成可解释的聚类,并对于两个中心点的情况,仅需要一个阈值切割即可实现常数近似。
Feb, 2020
提出了一个算法,用于在 $k$-medians 目标和 $k$-means 目标下输出可解释的聚类,与最佳聚类最多相差 $O (\log^2 k)$ 和 $O (k\log^2 k)$ 的因子,算法时间为 $O (dk\log^2 k)$ 。
Jun, 2021
我们研究了基于解释和准确性之间的平衡的 $k$-means 聚类算法,设计了一种新的解释性 $k$-means 聚类算法 ExKMC,用于有效地将数据集划分为 $k'$ 个叶子节点,并以 $k$ 个簇之一的形式对叶子节点进行标记。经实验验证,ExKMC 的聚类效果优于标准的决策树方法和其他解释性聚类算法。
Jun, 2020
本文提出了一种新型的复杂数据聚类算法,利用符号数据进行言语解释,通过最大化模块之间的一致性产生更好的聚类效果和高质量的聚类级别解释,实验结果表明,该模型在聚类性能方面优于竞争对手,并提供高质量的聚类级别解释。
May, 2021