Jun, 2021

高维情况下近似最优的可解释 k 均值算法

TL;DR介绍了一种可解释性聚类方法,算法通过应用决策树将数据划分为轴平行超平面聚类,使得聚类边界简单,同时保证聚类代价函数的可解释性约束,聚类的代价至多是比不考虑可解释性约束的情况最小代价增加 $k^{1-2/d}$ 倍,与其他方法的代价上界取最小值可得到 $k^{1-2/d} polylog (k)$ 倍,此为 $k,d ≥ 2$ 下的最优代价上界。