稳健的次高斯主成分分析与宽度独立的谱范数填充
本论文研究基于高维独立的高斯观测下,对总体协方差矩阵中的主要特征向量进行估计的问题。研究者们提出了一种基于坐标选择方案结合 PCA 的主要特征向量估计器,并证明了该估计器在稀疏条件下可以达到最优收敛速率。同时,也证明在某些情形下,通常的 PCA 可以达到最小最大收敛速率。
Feb, 2012
通过研究计算复杂性理论,发现在满足一定限制的协方差集中条件下存在有效的样本大小范围,在此范围内无法有随机多项式时间算法达到最佳极小风险率;对著名的半定松弛估计方法的理论性能进行研究,揭示了统计效率和计算效率之间微妙的相互作用,此方法为多维数据稀疏主成分分析提供了一种解决方案。
Aug, 2014
本文研究了高维 PCA 问题,通过添加 $k$-sparse 最大特征向量来扰动协方差矩阵,并分析了两种可计算的最大特征向量恢复方法:一种是简单的对角线阈值法,另一种是复杂的半定规划 (SDP) 松弛法,研究结果突出高维推断中计算与统计效率的权衡。
Mar, 2008
本文针对特征数比样本个数大的情况,提出了一种新的迭代阈值方法,用于估计主成分空间,这种方法在高维稀疏场景下实现了主成分空间和主要特征向量的一致恢复和最优恢复。模拟实例也证明了其具有竞争性的性能。
Dec, 2011
通过对协方差函数的未完全 Cholesky 分解,可以在近线性的复杂度内压缩、反演和近似 PCA 大量协方差矩阵,并提供了具有最佳收敛速度的近似稀疏 PCA。
Jun, 2017
本文介绍了一种基于凸优化和随机方法的新的高效 PCA 方法,该方法能够在很短的时间内计算出一个给定矩阵的主成分,并且在一定参数范围内实现了迄今最快的计算速度。
Sep, 2015
在 “可能但艰难” 的稀疏主成分分析中,我们使用亚指数时间算法的能力来探索稀疏度和恢复时间的平滑权衡,提供了一种新的演变家族,并对低阶似然比进行分析,从而证明了我们算法所实现的权衡是最优的。
Jul, 2019
本文将在线 PCA 转化为随机非凸优化问题,并将在线 PCA 算法分析为随机逼近迭代。在亚高斯假设下,我们证明了在线 PCA 算法的近乎最优有限样本误差界限,并且表明有限样本误差界限与极小信息下界紧密匹配。
Mar, 2016
通过探究样本协方差矩阵的主成分、大偏差估计以及异常值和非异常值特征向量的推导,得到了一些新的结论,如:具有信息量的主成分特征向量可以反映总体协方差矩阵的次临界模式。
Apr, 2014