本文针对特征数比样本个数大的情况,提出了一种新的迭代阈值方法,用于估计主成分空间,这种方法在高维稀疏场景下实现了主成分空间和主要特征向量的一致恢复和最优恢复。模拟实例也证明了其具有竞争性的性能。
Dec, 2011
本文介绍了一种名为门限法的难以置信的精简主方向载荷方法,并将其与半定规划松弛相结合,以改进主成分分析的解释性。
Jun, 2020
本文讨论了两种概率稀疏主成分分析模型:钉住 Wigner 模型和钉住 Wishart 模型,并分析了一个用于估计基本信号的近似信息传递 (AMP) 算法。在高维极限下,AMP 估计是信息理论上的最优。此外,本文提供了稀疏 PCA 问题的单字母特征。
Feb, 2014
本研究提出了一种新的稀疏 PCA 方法,旨在找到稀疏和几乎不相关的主成分,并具有正交的载荷向量,同时尽可能多地解释总方差。我们还开发了一种新的增广 Lagrangian 方法来解决一类非光滑约束优化问题,该方法非常适合我们的稀疏 PCA 公式。最后,我们将我们的稀疏 PCA 方法与其他方法在合成数据,随机数据和真实数据上进行比较。计算结果表明,我们的方法产生的稀疏主成分在总方差,主成分相关性和载荷向量的正交性等方面显着优于其他方法。
Jul, 2009
通过结构化稀疏主成分分析(Structured Sparse PCA)来处理数据,该方法通过拟定稀疏模式形状约束所有字典元素的稀疏性形状以实现对数据的高阶信息编码,提出了一种有效而简单的优化过程来解决这个问题,并在人脸识别和蛋白质复合物动态研究等两个相关任务上进行了试验,验证了该方法相对于非结构化方法的益处。
Sep, 2009
本文研究了利用主成分分析(PCA)和随机主成分分析(R-PCA)结合支持向量机(SVM)和轻量级梯度提升机(LightGBM)对高光谱图像进行分类的方法,实验结果表明,对于 Indian Pines 和 Pavia University 两个数据集,PCA 在 SVM 方面表现优于 R-PCA,但在 LightGBM 方面表现相近,Pavia University 和 Indian Pines 的最高分类准确率分别为 0.9925 和 0.9639。
Mar, 2024
本文介绍了一种基于经验贝叶斯(Empirical Bayes)的主成分分析(PCA)方法,通过估计主成分的共同先验分布来降低高维的噪声,同时运用了随机矩阵理论的分布结果和近似消息传递算法进行迭代修正,实验验证了该方法可以在有强先验结构的情况下显著提高 PCA 的性能。
Dec, 2020
通过研究计算复杂性理论,发现在满足一定限制的协方差集中条件下存在有效的样本大小范围,在此范围内无法有随机多项式时间算法达到最佳极小风险率;对著名的半定松弛估计方法的理论性能进行研究,揭示了统计效率和计算效率之间微妙的相互作用,此方法为多维数据稀疏主成分分析提供了一种解决方案。
Aug, 2014
使用稀疏 PCA 算法,选择最大方差的坐标子集,估计特征向量并在原始基础上重新表达,在适当的稀疏性假设下,实现一元模型的一致性估计。
Jan, 2009
本文介绍了一种快速的块升算法来实现稀疏主成分分析,该方法可以更好地解决特征数量很多的数据集的问题,并使用亿万级文档和成千上万个特征的文本语料库的实验结果证明了 Sparse PCA 对于组织大量文本数据具有很好的效果。
Oct, 2012