随机降维的普适性定律及其应用

Nov, 2015

Universality laws for randomized dimension reduction, with applications

Samet Oymak, Joel A. Tropp

TL;DR该论文研究了一类随机降维映射及其在高维随机几何学中的新普适性，证明在特定数据集上降维成功的概率存在相变现象，从而为数值线性代数算法、压缩感知、随机线性编码等提供了设计原则，并在随机实验设计下为统计估计方法的性能提供了启示。

Abstract

dimension reduction is the process of embedding high-dimensional data into a lower dimensional space to facilitate its analysis. In the Euclidean setting, one fundamental technique for dimension reduction is to a

dimension reduction random linear map embedding dimension phase transition universality laws

发现论文，激发创造

具有统计保证的随机降维

研究论文通过研究快速执行和数据利用的算法，探索了大型模型和数据利用的有效维度减少策略，以及提高泛化和分布鲁棒性的数据增强方法。

Oct, 2023

基于随机化的降维在设施定位和单链接聚类中的应用

本文研究将输入点集 $X$ 投影到随机 $d=O (d_X)$ 维子空间（其中 $d_X$ 是 $X$ 的双倍维数）的随机降维应用到聚类问题中，主要探讨了设施选址问题和单链接层次聚类问题。研究表明，这种方法在维度映射到一定程度时，可以达到在原始空间中找到的最优的设施选址近似值，同时这种方法还可以用于解决最小生成树等问题。

Jul, 2021

降维作为概率推断

本文提出了 ProbDR 变分框架，将许多经典的降维算法视为该框架下的概率推断算法。我们的框架利用低维潜变量构建协方差矩阵、精度矩阵或图拉普拉斯矩阵，这些矩阵可作为数据生成模型的一部分。利用此框架，我们可以更容易地处理未见数据，并且得到较为准确的高斯过程似然估计结果。

Apr, 2023

对比潜变量模型的无监督学习

本文提出了一种基于概率模型的降维方法，通过在目标数据集和背景数据集之间寻找信号富集的模式，能够恢复目标数据集中潜在空间中的有趣结构，并可应用于去噪、特征选择和子组发现等领域。

Nov, 2018

线性降维：调查、见解和概括

本文综述了一些线性降维方法，以及它们如何作为矩阵流形优化问题进行求解，并提出了一种基于正交投影的典型相关分析方法，这种优化框架使得线性降维成为了一种面向各种数据类型的黑盒子数值技术。

Jun, 2014

降维技术综述

研究试验生命科学数据分析中的维度缩减技术及其数学原理。

Mar, 2014

形成受控的维度缩减

通过提出非线性动力系统对移动 Agent 的形成控制来进行低维度表示，该系统由两部分组成：控制邻近点以解决局部结构问题和控制远程点以解决全局结构问题。数值实验在合成和真实数据集上进行，与现有模型进行比较表明所提出模型的稳固性和有效性。

Apr, 2024

通过受限等距性质进行任意集合的等角素描

本文表明一个特定结构的随机矩阵在降维方面类似于随机高斯矩阵，并且包括一些可以对矩阵 - 向量乘法进行 O (log n) 次计算的矩阵，从而提供了一种有效的通用集降维方法。通过连接任何集降维并使用链式论证将其连接到稀疏向量的降维，我们表明使用此类矩阵可以将高维度的任何集嵌入到较低的维度中，并且失真非常小。

Jun, 2015

分布式约简：用格罗莫夫 - 瓦瑟斯坦投影统一维度约简和聚类

使用优化运输工具把无监督学习、降维和聚类统一到一个框架中，解决聚类和降维的优化问题，通过实验验证了该方法在图像和基因组数据集上的卓越性能。

Feb, 2024

非线性谱降维在不确定性下的应用

本论文从理论和算法的角度探讨了在不确定性下的非线性降维问题。为了建模每个样本的不确定性，提出了一个新的降维框架 NGEU，它利用了概率分布来描述输入样本空间。通过分析 Rademacher 复杂度，论证了该方法在处理不确定数据时具有较强的泛化能力。

Feb, 2022