Jul, 2014

高维聚类的有影响特征的 PCA

TL;DR研究使用 Influential Features PCA (IF-PCA) 方法,通过选取 Kolmogorov-Smirnov(KS)得分最高的小部分特征,利用 k-means 算法估计标签来解决聚类问题,特别针对”p>>n” 现代情况中,传统聚类方法面临的挑战以及基因微阵列数据集中的错误率高问题,其在 10 个基因微阵列数据集中表现出竞争性较强的聚类效果,并在文中发现了关于实证零的现象以及三个数据集中”IF-PCA” 错误率极低的结果。