迭代式监督主成分分析

Oct, 2017

Iterative Supervised Principal Components

Juho Piironen, Aki Vehtari

TL;DR为了解决高维预测问题的计算难题，提出了一种基于 Bayesian 方法和新的维度缩减技术 ISPC 的预处理方法，在多个微阵列基准数据集上得到了很好的结果，并可用于高维数据可视化。

Abstract

In high-dimensional prediction problems, where the number of features may greatly exceed the number of training instances, fully bayesian approach with a sparsifying prior is known to produce good results but is

high-dimensional prediction bayesian approach dimension reduction iterative supervised principal components microarray datasets

发现论文，激发创造

稀疏主成分分析和迭代阈值法

本文针对特征数比样本个数大的情况，提出了一种新的迭代阈值方法，用于估计主成分空间，这种方法在高维稀疏场景下实现了主成分空间和主要特征向量的一致恢复和最优恢复。模拟实例也证明了其具有竞争性的性能。

Dec, 2011

稀疏主成分分析的近似算法

本文介绍了一种名为门限法的难以置信的精简主方向载荷方法，并将其与半定规划松弛相结合，以改进主成分分析的解释性。

Jun, 2020

信息论上最优稀疏主成分分析

本文讨论了两种概率稀疏主成分分析模型：钉住 Wigner 模型和钉住 Wishart 模型，并分析了一个用于估计基本信号的近似信息传递 (AMP) 算法。在高维极限下，AMP 估计是信息理论上的最优。此外，本文提供了稀疏 PCA 问题的单字母特征。

Feb, 2014

稀疏主成分分析的增广拉格朗日方法

本研究提出了一种新的稀疏 PCA 方法，旨在找到稀疏和几乎不相关的主成分，并具有正交的载荷向量，同时尽可能多地解释总方差。我们还开发了一种新的增广 Lagrangian 方法来解决一类非光滑约束优化问题，该方法非常适合我们的稀疏 PCA 公式。最后，我们将我们的稀疏 PCA 方法与其他方法在合成数据，随机数据和真实数据上进行比较。计算结果表明，我们的方法产生的稀疏主成分在总方差，主成分相关性和载荷向量的正交性等方面显着优于其他方法。

Jul, 2009

结构化稀疏主成分分析

通过结构化稀疏主成分分析（Structured Sparse PCA）来处理数据，该方法通过拟定稀疏模式形状约束所有字典元素的稀疏性形状以实现对数据的高阶信息编码，提出了一种有效而简单的优化过程来解决这个问题，并在人脸识别和蛋白质复合物动态研究等两个相关任务上进行了试验，验证了该方法相对于非结构化方法的益处。

Sep, 2009

基于随机主成分分析的高光谱图像分类

本文研究了利用主成分分析（PCA）和随机主成分分析（R-PCA）结合支持向量机（SVM）和轻量级梯度提升机（LightGBM）对高光谱图像进行分类的方法，实验结果表明，对于 Indian Pines 和 Pavia University 两个数据集，PCA 在 SVM 方面表现优于 R-PCA，但在 LightGBM 方面表现相近，Pavia University 和 Indian Pines 的最高分类准确率分别为 0.9925 和 0.9639。

Mar, 2024

高维情况下的经验贝叶斯主成分分析

本文介绍了一种基于经验贝叶斯（Empirical Bayes）的主成分分析（PCA）方法，通过估计主成分的共同先验分布来降低高维的噪声，同时运用了随机矩阵理论的分布结果和近似消息传递算法进行迭代修正，实验验证了该方法可以在有强先验结构的情况下显著提高 PCA 的性能。

Dec, 2020

稀疏主成分估计中的统计和计算折衷

通过研究计算复杂性理论，发现在满足一定限制的协方差集中条件下存在有效的样本大小范围，在此范围内无法有随机多项式时间算法达到最佳极小风险率；对著名的半定松弛估计方法的理论性能进行研究，揭示了统计效率和计算效率之间微妙的相互作用，此方法为多维数据稀疏主成分分析提供了一种解决方案。

Aug, 2014

稀疏主成分分析

使用稀疏 PCA 算法，选择最大方差的坐标子集，估计特征向量并在原始基础上重新表达，在适当的稀疏性假设下，实现一元模型的一致性估计。

Jan, 2009

大规模稀疏主成分分析及其在文本数据中的应用

本文介绍了一种快速的块升算法来实现稀疏主成分分析，该方法可以更好地解决特征数量很多的数据集的问题，并使用亿万级文档和成千上万个特征的文本语料库的实验结果证明了 Sparse PCA 对于组织大量文本数据具有很好的效果。

Oct, 2012