本文提出了一种具有隐私保护主成分分析(PPPCA)的多方建模范式,PPPCA 可以在本地保持明文数据的前提下完成 PCA 的多方协同执行,我们还使用两种技术,即同态加密和秘密共享,提出了实现。PPPCA 的输出可以直接发送给数据消费者以构建任何机器学习模型。我们在三个 UCI 基准数据集和一个真实世界的欺诈检测数据集上进行了实验,结果表明,建立在 PPPCA 之上的模型的准确率与基于集中式明文数据构建的 PCA 的模型相同。
Feb, 2020
本文探讨了不同 ially private PCA 方法的理论和实证性能,并提出了一种明确优化输出效用的新方法。我们发现其样本复杂度与现有程序的不同之处在于其与数据维度的缩放,而且在实际数据中,该方法与现有方法相比具有较大的性能差距。
Jul, 2012
通过对协方差函数的未完全 Cholesky 分解,可以在近线性的复杂度内压缩、反演和近似 PCA 大量协方差矩阵,并提供了具有最佳收敛速度的近似稀疏 PCA。
Jun, 2017
本文提出一种有效的算法,用于对任意规模的矩阵进行低秩逼近,可以在保证精度的同时大大提高计算效率,实验结果证明了算法的可行性。
Sep, 2008
提出了一个基于 HeteroPCA 算法的主成分分析(PCA)框架,该算法通过迭代地填充样本协方差矩阵的对角元素来消除异方差引起的估计偏差,提高了计算效率并在高维统计问题中得到了成功应用。
Oct, 2018
本文介绍了一种计算正半定矩阵的 k - 稀疏主成分的新算法,其通过查看低维度特征子空间中的一组离散特殊向量来实现。该算法的近似保证取决于其特征值分布,这使得其能够在多项式时间内对任意精度进行近似计算,同时几乎能够匹配或优于之前算法在所有测试数据集上的表现。
Mar, 2013
本文针对特征数比样本个数大的情况,提出了一种新的迭代阈值方法,用于估计主成分空间,这种方法在高维稀疏场景下实现了主成分空间和主要特征向量的一致恢复和最优恢复。模拟实例也证明了其具有竞争性的性能。
Dec, 2011
本论文研究基于高维独立的高斯观测下,对总体协方差矩阵中的主要特征向量进行估计的问题。研究者们提出了一种基于坐标选择方案结合 PCA 的主要特征向量估计器,并证明了该估计器在稀疏条件下可以达到最优收敛速率。同时,也证明在某些情形下,通常的 PCA 可以达到最小最大收敛速率。
Feb, 2012
本文提出了一种基于差分隐私算法的,可有效从高维数据集中生成低维合成数据的方法,通过运用私有主成分分析过程并保证符合 Wasserstein 距离的实用性保障,避免了维度诅咒问题。
May, 2023
本文研究具有多台服务器的分布式计算环境,通过开发 PCA 算法来处理点集的低维子空间问题,进而解决异常检测以及聚类等计算问题,提出的新算法显著降低了 $k$-means 聚类与相关问题的计算以及通讯成本,并且经过实验验证,在解决方案质量方面具有忽略不计的退化。
Aug, 2014