具有多个分量的稀疏PCA
本论文提出了一种基于协方差矩阵的稀疏主成分分析方法,采用半正定松弛和贪心算法求解,可以适用于诸如子集选择和稀疏恢复等领域,并能在人工和生物数据等实验数据中提供全局最优解。
Jul, 2007
本研究提出了一种新的稀疏PCA方法,旨在找到稀疏和几乎不相关的主成分,并具有正交的载荷向量,同时尽可能多地解释总方差。我们还开发了一种新的增广Lagrangian方法来解决一类非光滑约束优化问题,该方法非常适合我们的稀疏PCA公式。最后,我们将我们的稀疏PCA方法与其他方法在合成数据,随机数据和真实数据上进行比较。计算结果表明,我们的方法产生的稀疏主成分在总方差,主成分相关性和载荷向量的正交性等方面显着优于其他方法。
Jul, 2009
本文介绍了一种快速的块升算法来实现稀疏主成分分析,该方法可以更好地解决特征数量很多的数据集的问题,并使用亿万级文档和成千上万个特征的文本语料库的实验结果证明了 Sparse PCA 对于组织大量文本数据具有很好的效果。
Oct, 2012
提出一个名为 'tighten after relax' 的两阶段计算框架,其中第一阶段使用建议的凸松弛方法进行近似求解,第二阶段则通过直接求解基础非凸问题的新算法 'sparse orthogonal iteration pursuit' 来迭代优化初始估计值,并证明该框架的稳定性和最优性在特定模型类别下成立。
Aug, 2014
本文介绍一种新的基于多个不相交支撑的稀疏主成分分析算法,能够在多项式时间复杂度内,统一优化多个不相交的主成分,并且在真实数据集上的实验结果表明,在许多情况下,该算法能够胜过现有的基于排除法的方法。
Aug, 2015
该论文回顾了现有的优化方法来解决鲁棒PCA及其变体。论文讨论了这些方法的优缺点和收敛性,并提出了一些面向多处理器环境下解决大规模问题的新算法框架的可能研究方向。
Jun, 2018
通过将稀疏主成分分析重新制定为凸混合整数半定规划问题,并设计一个切平面方法,该方法可以以确切的最优性选择5个协变量从300个变量并能在更大范围内提供小的界限间隙。我们还提出了一种凸松弛和贪心舍入方案,可在几分钟内提供1-2%的绑定间隙,使其成为规模上的可行替代方法。使用真实的金融和医疗数据集,我们展示了我们的方法在可解释性和易于计算的情况下,在不同范围内可行性的能力。
May, 2020
该论文提出了两种混合整数SDP,用于优化选择主子矩阵的最大特征值,进一步分析和证明了它们的理论最优性差距优于现有技术,然后解决了在解决MISDP时存在的计算难题,同时提出了近似算法和 MILP 模型,有效地解决了规模问题,最后将其扩展到非对称矩阵和多个协方差矩阵的情况。
Aug, 2020
通过研究一种在尖峰维沙特模型下的主成分分析问题,我们揭示了信号中的结构通过一类子空间模型予以捕捉。在统计和计算统一的视角下,我们建立了依赖于问题实例几何结构的基本限制,并展示了一种自然的投影幂法在解的统计可接近最优邻域上表现出的局部收敛性。我们通过分析两个重要特例,即基于路径和树稀疏性的初始方法和匹配证据的计算难度,来补充这些结果。总体而言,我们的结果表明,多个针对普通稀疏主成分分析观察到的现象自然地扩展到其结构化对应物中。
Jul, 2023