概率主成分分析的双重表述

ICMLJul, 2023

A Dual Formulation for Probabilistic Principal Component Analysis

Henri De Plaen, Johan A. K. Suykens

TL;DR本文通过在希尔伯特空间中表征概率主成分分析并展示了其最优解的对偶空间表示，从而发展了一种基于核方法的生成性框架，并展示了该方法如何包含核主成分分析，并用一个玩具数据集和一个实际数据集进行了说明。

Abstract

In this paper, we characterize probabilistic principal component analysis in hilbert spaces and demonstrate how the optimal solution admits a representation in dual space. This allows us to develop a

probabilistic principal component analysis hilbert spaces generative framework kernel methods kernel principal component analysis

发现论文，激发创造

多视角受限核机中的对偶性

本文提出一种统一的设置，将现有的有限制的核机器方法融合到一个单一的原始对偶多视角框架中，用于核主成分分析，无论是在监督还是无监督的情况下。作者从理论角度推导了框架的原始和对偶表示，并将不同的训练和推断算法互相关联。通过重新调整原始变量，作者展示了如何在原始和对偶公式中实现完全等价。最后，作者通过递归预测未见测试数据和可视化学习特征在许多时间序列数据集上验证了等价性，并提供了不同方法之间关系的洞察。

May, 2023

通过对偶扩展核 PCA：稀疏性，鲁棒性和快速算法

本文通过 DC 函数的对偶化重新审视核主成分分析（KPCA），从而将 KPCA 自然地扩展到多个目标函数，并导致避免 Gram 矩阵的昂贵 SVD 的高效梯度下降算法。特别地，我们考虑可以写成 Moreau 套外壳的目标函数，展示了如何在同一框架中促进鲁棒性和稀疏性。提出的方法在合成和实际基准测试中进行了评估，显示出 KPCA 训练时间的显着加速以及在鲁棒性和稀疏性方面的好处。

Jun, 2023

数据集上的主成分分析的两种导出方法

本文提出了一种针对数据集不是点而是分布的主成分分析方法，可以从方差最大化原则和重构误差最小化的角度获得闭合解。

Jun, 2023

生成主成分分析

本文研究采用生成建模假设的主成分分析问题，提出了一个二次估计器，并在各种图像数据集上进行了实验。

Mar, 2022

改进的分布式主成分分析

本文研究具有多台服务器的分布式计算环境，通过开发 PCA 算法来处理点集的低维子空间问题，进而解决异常检测以及聚类等计算问题，提出的新算法显著降低了 $k$-means 聚类与相关问题的计算以及通讯成本，并且经过实验验证，在解决方案质量方面具有忽略不计的退化。

Aug, 2014

鲁棒主成分分析？

本文介绍了一种名为主成分追踪的凸型优化方法，能在有噪声或缺损情况下准确分离一个 $ m * n $ 数据矩阵的低秩和稀疏成分，该方法有望应用于视频监控和人脸识别等领域。

Dec, 2009

在线线性、鲁棒和非线性子空间学习的内在 Grassmann 平均值

本文提出了一种用于计算主要线性子空间的几何框架，并比较了 PCA 和 KPCA 的效率和性能。

Feb, 2017

公平主成分分析的凸优化方法

本文研究了 PCA 背景下的公平性问题，并提出了 “公平降维” 的定义，即保护类别的信息不能从降维后的数据点推断出来。作者发展了凸优化公式来提高 PCA 和核 PCA 的公平性，并在几个数据集上展示了其有效性。最后，演示了如何使用该方法对健康数据进行公平（针对年龄）聚类，该数据可以用于设定健康保险费率。

Feb, 2018

差分隐私主成分的近似最优算法

本文探讨了不同 ially private PCA 方法的理论和实证性能，并提出了一种明确优化输出效用的新方法。我们发现其样本复杂度与现有程序的不同之处在于其与数据维度的缩放，而且在实际数据中，该方法与现有方法相比具有较大的性能差距。

Jul, 2012

高维数据的差分隐私低维表示

本文提出了一种基于差分隐私算法的，可有效从高维数据集中生成低维合成数据的方法，通过运用私有主成分分析过程并保证符合 Wasserstein 距离的实用性保障，避免了维度诅咒问题。

May, 2023