预定主成分分析：两阶段随机优化的降维

Jun, 2023

预定主成分分析：两阶段随机优化的降维

Prescriptive PCA: Dimensionality Reduction for Two-stage Stochastic Optimization

Long He, Ho-Yin Mak

TL;DR本文讨论了将高维数据的低维表示学习任务与用该表示解决随机规划的优化任务进行对齐，提出了通过解决分布鲁棒优化问题实现预制降维的框架。实验表明，该方法在仓库中转问题和车辆重定位问题上明显优于传统的主成分分析方法。

Abstract

In this paper, we consider the alignment between an upstream dimensionality reduction task of learning a low-dimensional representation of a set of high-dimensional data and a downstream optimization task of solving a stochastic program parameterized by said representation. In this case, standard →

dimensionality reduction stochastic optimization prescriptive framework distributionally-robust optimization semidefinite programming

发现论文，激发创造

迭代式监督主成分分析

为了解决高维预测问题的计算难题，提出了一种基于 Bayesian 方法和新的维度缩减技术 ISPC 的预处理方法，在多个微阵列基准数据集上得到了很好的结果，并可用于高维数据可视化。

Oct, 2017

学习增强的降维 K 均值聚类

使用主成分分析（PCA）降低数据集的维度，提高 k-means 算法在特定质心下的预测性能和降低成本。

Jan, 2024

通过测地线下降实现分布鲁棒公平主成分

本文提出一种在主成分分析中内在于目标函数中的公正准则的分布式稳健优化问题，通过采用超越最小二乘意义的子群重构误差之间的重构误差差异，平衡了总体重建误差和子群之间的重建误差差异，以及实验证明该方法较其他现有方法有明显优势。

Feb, 2022

高效公平主成分分析

提出一种适应性一阶算法，通过使用 Pareto 最优性的概念来学习保持公平性，同时略微牺牲重构损失的子空间，证明了该算法的解对于所有敏感群体都属于 Pareto 前沿，从而保证了整体重建损失和公平约束之间的最优权衡，并提供了收敛分析和验证了该算法在各种数据集上的优异性能。该算法可有效地将不公平决策降至最低，并可推广至多组敏感特征。

Nov, 2019

基于随机投影的降维技术综述

本文总结了基于随机投影的不同方法的使用情况，旨在帮助实践者为其特定应用选择合适的技术，并列举了各种方法的优缺点，并为研究人员提供进一步的参考，以开发新的基于随机投影的方法。

Jun, 2017

解决大规模稀疏 PCA 至可证明（近似）最优

通过将稀疏主成分分析重新制定为凸混合整数半定规划问题，并设计一个切平面方法，该方法可以以确切的最优性选择 5 个协变量从 300 个变量并能在更大范围内提供小的界限间隙。我们还提出了一种凸松弛和贪心舍入方案，可在几分钟内提供 1-2％的绑定间隙，使其成为规模上的可行替代方法。使用真实的金融和医疗数据集，我们展示了我们的方法在可解释性和易于计算的情况下，在不同范围内可行性的能力。

May, 2020

用主成分分析估计数据的内在维度

本文介绍了一种基于 PCA 的新方法，用于估计具有非线性结构的数据的内在维数，该方法利用整个数据集估计其内在维数，并方便增量学习。该方法使用数据的最小覆盖来处理数据集的非线性结构，并通过检查所有小邻域区域的数据方差来确定估计结果。实验结果表明，该方法可以过滤数据中的噪声，并在邻域区域大小增加时收敛到稳定的估计值。

Feb, 2010

线性降维：调查、见解和概括

本文综述了一些线性降维方法，以及它们如何作为矩阵流形优化问题进行求解，并提出了一种基于正交投影的典型相关分析方法，这种优化框架使得线性降维成为了一种面向各种数据类型的黑盒子数值技术。

Jun, 2014

公平主成分分析的凸优化方法

本文研究了 PCA 背景下的公平性问题，并提出了 “公平降维” 的定义，即保护类别的信息不能从降维后的数据点推断出来。作者发展了凸优化公式来提高 PCA 和核 PCA 的公平性，并在几个数据集上展示了其有效性。最后，演示了如何使用该方法对健康数据进行公平（针对年龄）聚类，该数据可以用于设定健康保险费率。

Feb, 2018

降维作为概率推断

本文提出了 ProbDR 变分框架，将许多经典的降维算法视为该框架下的概率推断算法。我们的框架利用低维潜变量构建协方差矩阵、精度矩阵或图拉普拉斯矩阵，这些矩阵可作为数据生成模型的一部分。利用此框架，我们可以更容易地处理未见数据，并且得到较为准确的高斯过程似然估计结果。

Apr, 2023