Jul, 2011
聚类中的数据稳定性:深入研究
Data Stability in Clustering: A Closer Look
Shalev Ben-David, Lev Reyzin
TL;DR本文考虑了 Bilu 和 Linial(2010)提出的模型,研究了最佳聚类不发生变化的问题,我们发现即使问题是 NP 困难的,有时候也可能获得有效算法,这些算法对于特定的多项式扰动是鲁棒的。同时,我们证明了该区间内的乘法鲁棒性参数可能太强,以至于聚类问题变得微不足道,只有一个较窄的区间是有趣的。