稀疏主成分分析
本文针对特征数比样本个数大的情况,提出了一种新的迭代阈值方法,用于估计主成分空间,这种方法在高维稀疏场景下实现了主成分空间和主要特征向量的一致恢复和最优恢复。模拟实例也证明了其具有竞争性的性能。
Dec, 2011
本研究提出了一种新的稀疏 PCA 方法,旨在找到稀疏和几乎不相关的主成分,并具有正交的载荷向量,同时尽可能多地解释总方差。我们还开发了一种新的增广 Lagrangian 方法来解决一类非光滑约束优化问题,该方法非常适合我们的稀疏 PCA 公式。最后,我们将我们的稀疏 PCA 方法与其他方法在合成数据,随机数据和真实数据上进行比较。计算结果表明,我们的方法产生的稀疏主成分在总方差,主成分相关性和载荷向量的正交性等方面显着优于其他方法。
Jul, 2009
本文研究了高维 PCA 问题,通过添加 $k$-sparse 最大特征向量来扰动协方差矩阵,并分析了两种可计算的最大特征向量恢复方法:一种是简单的对角线阈值法,另一种是复杂的半定规划 (SDP) 松弛法,研究结果突出高维推断中计算与统计效率的权衡。
Mar, 2008
研究 PCA 在高维,低样本大小的情况下的渐近行为,发现在一些充分的条件下,估计的 PC 方向是一致的,其他的方向强不一致,而这些条件在主定理中指定。
Nov, 2009
本文讨论了两种概率稀疏主成分分析模型:钉住 Wigner 模型和钉住 Wishart 模型,并分析了一个用于估计基本信号的近似信息传递 (AMP) 算法。在高维极限下,AMP 估计是信息理论上的最优。此外,本文提供了稀疏 PCA 问题的单字母特征。
Feb, 2014
本研究提出一种新的方法,通过将正交性条件重新表述为秩约束,并同时优化稀疏性和秩约束,使得稀疏主成分分析问题更易解决。通过设计合理的半定松弛和可行的二阶锥不等式,本文的方法在实际数据集中可以获得最优解,并且相比现有方法具有更好的性能。
Sep, 2022
本文介绍了一种快速的块升算法来实现稀疏主成分分析,该方法可以更好地解决特征数量很多的数据集的问题,并使用亿万级文档和成千上万个特征的文本语料库的实验结果证明了 Sparse PCA 对于组织大量文本数据具有很好的效果。
Oct, 2012
通过研究计算复杂性理论,发现在满足一定限制的协方差集中条件下存在有效的样本大小范围,在此范围内无法有随机多项式时间算法达到最佳极小风险率;对著名的半定松弛估计方法的理论性能进行研究,揭示了统计效率和计算效率之间微妙的相互作用,此方法为多维数据稀疏主成分分析提供了一种解决方案。
Aug, 2014
本文讨论了稀疏主成分分析 (sPCA) 方法中的一些问题,尤其是在计算分数、残差和方差解释时,与传统的主成分分析 (PCA) 方法不同,并展示了该方法在建模无噪声、稀疏数据时表现出不一致和有限的性能。
Jul, 2019