具有多个分量的稀疏 PCA
本研究提出了一种新的稀疏 PCA 方法,旨在找到稀疏和几乎不相关的主成分,并具有正交的载荷向量,同时尽可能多地解释总方差。我们还开发了一种新的增广 Lagrangian 方法来解决一类非光滑约束优化问题,该方法非常适合我们的稀疏 PCA 公式。最后,我们将我们的稀疏 PCA 方法与其他方法在合成数据,随机数据和真实数据上进行比较。计算结果表明,我们的方法产生的稀疏主成分在总方差,主成分相关性和载荷向量的正交性等方面显着优于其他方法。
Jul, 2009
本文研究了高维 PCA 问题,通过添加 $k$-sparse 最大特征向量来扰动协方差矩阵,并分析了两种可计算的最大特征向量恢复方法:一种是简单的对角线阈值法,另一种是复杂的半定规划 (SDP) 松弛法,研究结果突出高维推断中计算与统计效率的权衡。
Mar, 2008
本论文提出了一种基于协方差矩阵的稀疏主成分分析方法,采用半正定松弛和贪心算法求解,可以适用于诸如子集选择和稀疏恢复等领域,并能在人工和生物数据等实验数据中提供全局最优解。
Jul, 2007
通过将稀疏主成分分析重新制定为凸混合整数半定规划问题,并设计一个切平面方法,该方法可以以确切的最优性选择 5 个协变量从 300 个变量并能在更大范围内提供小的界限间隙。我们还提出了一种凸松弛和贪心舍入方案,可在几分钟内提供 1-2%的绑定间隙,使其成为规模上的可行替代方法。使用真实的金融和医疗数据集,我们展示了我们的方法在可解释性和易于计算的情况下,在不同范围内可行性的能力。
May, 2020
本文介绍一种新的基于多个不相交支撑的稀疏主成分分析算法,能够在多项式时间复杂度内,统一优化多个不相交的主成分,并且在真实数据集上的实验结果表明,在许多情况下,该算法能够胜过现有的基于排除法的方法。
Aug, 2015
本文讨论了两种概率稀疏主成分分析模型:钉住 Wigner 模型和钉住 Wishart 模型,并分析了一个用于估计基本信号的近似信息传递 (AMP) 算法。在高维极限下,AMP 估计是信息理论上的最优。此外,本文提供了稀疏 PCA 问题的单字母特征。
Feb, 2014
本论文研究基于高维独立的高斯观测下,对总体协方差矩阵中的主要特征向量进行估计的问题。研究者们提出了一种基于坐标选择方案结合 PCA 的主要特征向量估计器,并证明了该估计器在稀疏条件下可以达到最优收敛速率。同时,也证明在某些情形下,通常的 PCA 可以达到最小最大收敛速率。
Feb, 2012
本文介绍了一种快速的块升算法来实现稀疏主成分分析,该方法可以更好地解决特征数量很多的数据集的问题,并使用亿万级文档和成千上万个特征的文本语料库的实验结果证明了 Sparse PCA 对于组织大量文本数据具有很好的效果。
Oct, 2012