基于二分图匹配的稀疏 PCA
本研究提出一种新的方法,通过将正交性条件重新表述为秩约束,并同时优化稀疏性和秩约束,使得稀疏主成分分析问题更易解决。通过设计合理的半定松弛和可行的二阶锥不等式,本文的方法在实际数据集中可以获得最优解,并且相比现有方法具有更好的性能。
Sep, 2022
该论文提出了两种混合整数 SDP,用于优化选择主子矩阵的最大特征值,进一步分析和证明了它们的理论最优性差距优于现有技术,然后解决了在解决 MISDP 时存在的计算难题,同时提出了近似算法和 MILP 模型,有效地解决了规模问题,最后将其扩展到非对称矩阵和多个协方差矩阵的情况。
Aug, 2020
本论文提出了一种基于协方差矩阵的稀疏主成分分析方法,采用半正定松弛和贪心算法求解,可以适用于诸如子集选择和稀疏恢复等领域,并能在人工和生物数据等实验数据中提供全局最优解。
Jul, 2007
本文介绍了一种计算正半定矩阵的 k - 稀疏主成分的新算法,其通过查看低维度特征子空间中的一组离散特殊向量来实现。该算法的近似保证取决于其特征值分布,这使得其能够在多项式时间内对任意精度进行近似计算,同时几乎能够匹配或优于之前算法在所有测试数据集上的表现。
Mar, 2013
本文研究了高维 PCA 问题,通过添加 $k$-sparse 最大特征向量来扰动协方差矩阵,并分析了两种可计算的最大特征向量恢复方法:一种是简单的对角线阈值法,另一种是复杂的半定规划 (SDP) 松弛法,研究结果突出高维推断中计算与统计效率的权衡。
Mar, 2008
本研究提出了一种新的稀疏 PCA 方法,旨在找到稀疏和几乎不相关的主成分,并具有正交的载荷向量,同时尽可能多地解释总方差。我们还开发了一种新的增广 Lagrangian 方法来解决一类非光滑约束优化问题,该方法非常适合我们的稀疏 PCA 公式。最后,我们将我们的稀疏 PCA 方法与其他方法在合成数据,随机数据和真实数据上进行比较。计算结果表明,我们的方法产生的稀疏主成分在总方差,主成分相关性和载荷向量的正交性等方面显着优于其他方法。
Jul, 2009
本文介绍了一种快速的块升算法来实现稀疏主成分分析,该方法可以更好地解决特征数量很多的数据集的问题,并使用亿万级文档和成千上万个特征的文本语料库的实验结果证明了 Sparse PCA 对于组织大量文本数据具有很好的效果。
Oct, 2012
通过将稀疏主成分分析重新制定为凸混合整数半定规划问题,并设计一个切平面方法,该方法可以以确切的最优性选择 5 个协变量从 300 个变量并能在更大范围内提供小的界限间隙。我们还提出了一种凸松弛和贪心舍入方案,可在几分钟内提供 1-2%的绑定间隙,使其成为规模上的可行替代方法。使用真实的金融和医疗数据集,我们展示了我们的方法在可解释性和易于计算的情况下,在不同范围内可行性的能力。
May, 2020
本文介绍了一种名为主成分追踪的凸型优化方法,能在有噪声或缺损情况下准确分离一个 $ m * n $ 数据矩阵的低秩和稀疏成分,该方法有望应用于视频监控和人脸识别等领域。
Dec, 2009