异方差 PCA: 算法,最优性和应用
本文分析了高维数据降维方法主成分分析 (PCA) 在异方差噪声干扰下的表现,并通过简化的表达式提供了计算 PCA 成功从噪声数据中恢复样本真实的子空间和子空间系数的方法,证明了在固定平均噪声方差的情况下,异方差噪声下 PCA 的表现总是低于同方差噪声下 PCA 的表现。
Mar, 2017
研究如何从高维、异方差数据中估计主成分,提出使用加权样本协方差矩阵的主特征向量来考虑方差的异质性,并证明了在一些自然的统计假设下,最优权重收敛为信号和噪声方差的简单函数;此外,讨论了如何在未知方差的情况下使用估计的信噪比,最后通过天文数据的比较展示了理论结果。
Oct, 2018
本研究提出了一种新的稀疏 PCA 方法,旨在找到稀疏和几乎不相关的主成分,并具有正交的载荷向量,同时尽可能多地解释总方差。我们还开发了一种新的增广 Lagrangian 方法来解决一类非光滑约束优化问题,该方法非常适合我们的稀疏 PCA 公式。最后,我们将我们的稀疏 PCA 方法与其他方法在合成数据,随机数据和真实数据上进行比较。计算结果表明,我们的方法产生的稀疏主成分在总方差,主成分相关性和载荷向量的正交性等方面显着优于其他方法。
Jul, 2009
本文针对特征数比样本个数大的情况,提出了一种新的迭代阈值方法,用于估计主成分空间,这种方法在高维稀疏场景下实现了主成分空间和主要特征向量的一致恢复和最优恢复。模拟实例也证明了其具有竞争性的性能。
Dec, 2011
提出一种新的基于加权方差协方差矩阵的双谱分解方法,旨在在具有加权和 / 或缺失数据问题的情况下,检索给定数量的正交主成分,该方法通过将主成分拟合到数据并进行分解,从而检索主系数。通过在实际情况和模拟情况下进行测试,结果表明该方法能够在数据集中识别最显著的模式,并且可以使用此方法将 Sloan Digital Sky Survey 类星体光谱从测量波长外推至更短和更长波长。同时该算法的实现速度快且灵活。
Dec, 2014
该论文研究了主成分分析(PCA)在数据和噪声存在相关性或互相依赖的情况下的应用。通过简单的数据和噪声相关性假设,该论文提出了一种基于标准特征值分解(EVD)的 PCA 解决方案的正确性结果,并且提出了一种泛化的 EVD 方案 - cluster-EVD,在特定情况下改善了 EVD。
Aug, 2016
本文介绍了针对 MATLAB 的基于随机化方法的低秩逼近算法,通过多个测试发现这些算法在准确性、速度和内存使用、易用性、可并行性和可靠性等方面都优于或至少与经典方法相当,但对于估计谱范数和计算最小奇异值及对应的奇异向量依然有待提高。
Dec, 2014
研究 PCA 在高维,低样本大小的情况下的渐近行为,发现在一些充分的条件下,估计的 PC 方向是一致的,其他的方向强不一致,而这些条件在主定理中指定。
Nov, 2009