Feb, 2024

Oja 阈值处理是否实现稀疏 PCA?

TL;DR稀疏主成分分析 (Sparse Principal Component Analysis, PCA) 的问题,当比率 $d/n ightarrow c > 0$ 时进行研究。针对在线优化问题,我们提出一种简单的算法,通过阈值和重新归一化 Oja 算法的输出 (即 Oja 向量),获得接近最优的误差率。这是非常令人惊讶的,因为没有阈值时,Oja 向量存在很大的误差。我们的分析主要围绕未归一化 Oja 向量的元素进行界定,其中涉及到独立随机矩阵乘积在随机初始向量上的投影,这是非常复杂且新颖的,因为对 Oja 算法和矩阵乘积的先前分析是在限制了总体协方差矩阵的迹的情况下进行的,而在我们的情境中,这个量可以达到 $n$ 的大小。