超越 PCA：一种概率 Gram-Schmidt 方法进行特征提取

Nov, 2023

超越 PCA：一种概率 Gram-Schmidt 方法进行特征提取

Beyond PCA: A Probabilistic Gram-Schmidt Approach to Feature Extraction

Bahram Yaghooti, Netanel Raviv, Bruno Sinopoli

TL;DR使用概率格拉姆 - 施密特（PGS）正交化过程来探测和映射冗余维度，并通过该过程结合捕捉数据中非线性依赖的函数族构建一系列协方差矩阵，从而提取线性特征并移除非线性冗余。

Abstract

linear feature extraction at the presence of nonlinear dependencies among the data is a fundamental challenge in unsupervised learning. We propose using a →

linear feature extraction nonlinear dependencies probabilistic gram-schmidt covariance matrices principal components

发现论文，激发创造

图上稳健主成分分析

本文介绍了一种名为 “在图上强鲁棒性主成分分析” 的新模型，它将谱图正则化纳入了 Robust PCA 框架中，从而具有主成分丰富性、改进的低秩恢复、改进的聚类性质和凸优化问题等优点，从实验结果来看，模型在聚类和低秩恢复任务方面表现优异，优于其他十种最先进的模型。

Apr, 2015

图上快速鲁棒主成分分析

本文提出了一种基于主成分分析（PCA）的解决方案，通过设计凸优化问题来实现对高维数据集的低秩恢复，重点解决了高计算复杂性、非凸性和数据中的大量异常问题，同时经过了 7 组基准数据集的聚类实验和 3 组视频数据集的背景分离实验的测试，结果表明我们提出的模型优于 10 种最先进的降维模型。

Jul, 2015

稀疏主成分分析和迭代阈值法

本文针对特征数比样本个数大的情况，提出了一种新的迭代阈值方法，用于估计主成分空间，这种方法在高维稀疏场景下实现了主成分空间和主要特征向量的一致恢复和最优恢复。模拟实例也证明了其具有竞争性的性能。

Dec, 2011

稀疏主成分分析的增广拉格朗日方法

本研究提出了一种新的稀疏 PCA 方法，旨在找到稀疏和几乎不相关的主成分，并具有正交的载荷向量，同时尽可能多地解释总方差。我们还开发了一种新的增广 Lagrangian 方法来解决一类非光滑约束优化问题，该方法非常适合我们的稀疏 PCA 公式。最后，我们将我们的稀疏 PCA 方法与其他方法在合成数据，随机数据和真实数据上进行比较。计算结果表明，我们的方法产生的稀疏主成分在总方差，主成分相关性和载荷向量的正交性等方面显着优于其他方法。

Jul, 2009

随机非线性成分分析

通过利用随机性设计了新的可伸缩非线性 PCA 和 CCA 变体，并扩展到关键的多元分析工具，例如谱聚类或 LDA，并在真实世界的数据上进行了实验，与最先进的方法进行了比较。

Feb, 2014

多个主成分分析研究之间的知识转移

我们提出了一种两步传递学习算法，通过从多个主成分分析（PCA）研究中提取有用信息来增强目标 PCA 任务的估计精度，并对理论进行了分析，证明了在知识传递之后经验谱投影矩阵的双线性形式在较弱的特征值间隔条件下渐进地正态分布。

Mar, 2024

稀疏主成分分析

使用稀疏 PCA 算法，选择最大方差的坐标子集，估计特征向量并在原始基础上重新表达，在适当的稀疏性假设下，实现一元模型的一致性估计。

Jan, 2009

剩余分量分析：在线性高斯模型中推广 PCA 以获得更灵活的推断能力

本文提出了一种新的基于残差方差的概率主成分分析 (PPCA) 模型 —— 残差成分分析 (RCA)，并探讨了由此框架产生的新算法，其中包括将高斯密度的协方差分解为低秩与稀疏逆两个部分的算法。作者在蛋白质信号网络恢复，基因表达时间序列数据集分析以及基于三维点云数据恢复人类骨架方面阐述了该模型的应用。

Jun, 2012

用主成分分析估计数据的内在维度

本文介绍了一种基于 PCA 的新方法，用于估计具有非线性结构的数据的内在维数，该方法利用整个数据集估计其内在维数，并方便增量学习。该方法使用数据的最小覆盖来处理数据集的非线性结构，并通过检查所有小邻域区域的数据方差来确定估计结果。实验结果表明，该方法可以过滤数据中的噪声，并在邻域区域大小增加时收敛到稳定的估计值。

Feb, 2010

无限潜变量特征选择：基于概率潜图的排名方法

本文提出了一种基于概率潜变量图的鲁棒性特征选择算法，它通过将特征子集视为图上的路径，在考虑所有特征子集的同时执行排名步骤，并将相关性建模为 PLSA 启发式生成过程中的潜在变量。实验表明，该方法在许多不同的场景和难度下都可获得最高性能水平，并在特征选择领域设定了一个新的最佳状态。

Jul, 2017