关于可解释性的代价在某些聚类问题中的研究

Jan, 2021

关于可解释性的代价在某些聚类问题中的研究

On the price of explainability for some clustering problems

Eduardo Laber, Lucas Murtinho

TL;DR通过测试，我们发现，在进行 k-means 分类问题时，通过利用决策树可增强算法可解释性，提高性能表现。

Abstract

The price of explainability for a clustering task can be defined as the unavoidable loss,in terms of the objective function, if we force t

explainability clustering objective function decision trees k-means

发现论文，激发创造

高维情况下近似最优的可解释 k 均值算法

介绍了一种可解释性聚类方法，算法通过应用决策树将数据划分为轴平行超平面聚类，使得聚类边界简单，同时保证聚类代价函数的可解释性约束，聚类的代价至多是比不考虑可解释性约束的情况最小代价增加 $k^{1-2/d}$ 倍，与其他方法的代价上界取最小值可得到 $k^{1-2/d} polylog (k)$ 倍，此为 $k,d ≥ 2$ 下的最优代价上界。

Jun, 2021

可解释聚类的近乎紧密且无感知算法

提出了一个算法，用于在 $k$-medians 目标和 $k$-means 目标下输出可解释的聚类，与最佳聚类最多相差 $O (\log^2 k)$ 和 $O (k\log^2 k)$ 的因子，算法时间为 $O (dk\log^2 k)$ 。

Jun, 2021

可解释的 K 均值和 K 中值聚类

本文提出了一种使用决策树对数据集进行聚类的算法，并探讨了该方法对 k-means 和 k-medians 目标函数的适用性。作者证明了常见的自顶向下决策树算法可能会导致成本任意大的聚类结果，但设计了一种有效的方法使用具有 k 个叶子的树生成可解释的聚类，并对于两个中心点的情况，仅需要一个阈值切割即可实现常数近似。

Feb, 2020

可解释聚类中深度减少的不可能性

本文研究可解释 K-means 和 K-median 聚类问题，证明了在欧几里得平面上，解释深度降低会导致聚类成本的无界损失，并将其扩展到 K-center 目标。

May, 2023

ExKMC: 扩展可解释的 K - 均值聚类

我们研究了基于解释和准确性之间的平衡的 $k$-means 聚类算法，设计了一种新的解释性 $k$-means 聚类算法 ExKMC，用于有效地将数据集划分为 $k'$ 个叶子节点，并以 $k$ 个簇之一的形式对叶子节点进行标记。经实验验证，ExKMC 的聚类效果优于标准的决策树方法和其他解释性聚类算法。

Jun, 2020

可解释聚类的近似最紧算法

本文研究了一个最近提出的可解释聚类框架，专注于 k-medians 和 k-means 问题，并提供了近似算法和上下界。

Jul, 2021

走向可解释聚类：基于约束声明的方法

我们提出了一种基于解释驱动的集群选择的解释可调的约束聚类方法，该方法能够生成高质量的且可解释的聚类，其中聚类结果考虑了特征的覆盖率和区分度，并能够整合领域专家知识和用户约束。

Mar, 2024

通过决策树解读核聚类

探索可解释的核聚类算法，提出构建决策树来近似核 k-means 引发的分区的算法，并展示了适当选择特征如何在不损失可解释模型的近似保证的情况下保持可解释性。

Feb, 2024

可解释的 k-Medians 和 k-Means 的近似最优算法

研究在可解释的 k - 中位数和 k - 均值问题中，提出了一种新的算法并分析了其竞争性和下界。

Jul, 2021

具有差分隐私的对比可解释聚类

本研究提出了一种新的可解释人工智能（XAI）方法，在聚类方法中将对比解释与差分隐私相结合。通过在常见的聚类问题中（包括 k - 中值和 k - 均值），我们给出了高效的差分隐私对比解释，能够获得与非差分隐私聚类解释基本一致的解释。在每个对比场景中，我们将一个特定数据点指定为固定的质心位置，以衡量这种约束对基于差分隐私的聚类结果的影响。在各种数据集上进行的广泛实验表明我们方法在不明显损害数据隐私或聚类效果的情况下提供有意义的解释，突出了我们对隐私感知机器学习的贡献，证明了在聚类任务解释中在隐私和效用之间实现平衡的可行性。

Jun, 2024