Feb, 2010

用主成分分析估计数据的内在维度

TL;DR本文介绍了一种基于PCA的新方法,用于估计具有非线性结构的数据的内在维数,该方法利用整个数据集估计其内在维数,并方便增量学习。该方法使用数据的最小覆盖来处理数据集的非线性结构,并通过检查所有小邻域区域的数据方差来确定估计结果。实验结果表明,该方法可以过滤数据中的噪声,并在邻域区域大小增加时收敛到稳定的估计值。