概率主成分分析的双重表述
本文提出一种统一的设置,将现有的有限制的核机器方法融合到一个单一的原始对偶多视角框架中,用于核主成分分析,无论是在监督还是无监督的情况下。作者从理论角度推导了框架的原始和对偶表示,并将不同的训练和推断算法互相关联。通过重新调整原始变量,作者展示了如何在原始和对偶公式中实现完全等价。最后,作者通过递归预测未见测试数据和可视化学习特征在许多时间序列数据集上验证了等价性,并提供了不同方法之间关系的洞察。
May, 2023
本文通过 DC 函数的对偶化重新审视核主成分分析(KPCA),从而将 KPCA 自然地扩展到多个目标函数,并导致避免 Gram 矩阵的昂贵 SVD 的高效梯度下降算法。特别地,我们考虑可以写成 Moreau 套外壳的目标函数,展示了如何在同一框架中促进鲁棒性和稀疏性。提出的方法在合成和实际基准测试中进行了评估,显示出 KPCA 训练时间的显着加速以及在鲁棒性和稀疏性方面的好处。
Jun, 2023
本文研究具有多台服务器的分布式计算环境,通过开发 PCA 算法来处理点集的低维子空间问题,进而解决异常检测以及聚类等计算问题,提出的新算法显著降低了 $k$-means 聚类与相关问题的计算以及通讯成本,并且经过实验验证,在解决方案质量方面具有忽略不计的退化。
Aug, 2014
本文介绍了一种名为主成分追踪的凸型优化方法,能在有噪声或缺损情况下准确分离一个 $ m * n $ 数据矩阵的低秩和稀疏成分,该方法有望应用于视频监控和人脸识别等领域。
Dec, 2009
本文研究了 PCA 背景下的公平性问题,并提出了 “公平降维” 的定义,即保护类别的信息不能从降维后的数据点推断出来。作者发展了凸优化公式来提高 PCA 和核 PCA 的公平性,并在几个数据集上展示了其有效性。最后,演示了如何使用该方法对健康数据进行公平(针对年龄)聚类,该数据可以用于设定健康保险费率。
Feb, 2018
本文探讨了不同 ially private PCA 方法的理论和实证性能,并提出了一种明确优化输出效用的新方法。我们发现其样本复杂度与现有程序的不同之处在于其与数据维度的缩放,而且在实际数据中,该方法与现有方法相比具有较大的性能差距。
Jul, 2012
本文提出了一种基于差分隐私算法的,可有效从高维数据集中生成低维合成数据的方法,通过运用私有主成分分析过程并保证符合 Wasserstein 距离的实用性保障,避免了维度诅咒问题。
May, 2023