研究论文通过研究快速执行和数据利用的算法,探索了大型模型和数据利用的有效维度减少策略,以及提高泛化和分布鲁棒性的数据增强方法。
Oct, 2023
本文研究将输入点集 $X$ 投影到随机 $d=O (d_X)$ 维子空间(其中 $d_X$ 是 $X$ 的双倍维数)的随机降维应用到聚类问题中,主要探讨了设施选址问题和单链接层次聚类问题。研究表明,这种方法在维度映射到一定程度时,可以达到在原始空间中找到的最优的设施选址近似值,同时这种方法还可以用于解决最小生成树等问题。
Jul, 2021
本文提出了 ProbDR 变分框架,将许多经典的降维算法视为该框架下的概率推断算法。我们的框架利用低维潜变量构建协方差矩阵、精度矩阵或图拉普拉斯矩阵,这些矩阵可作为数据生成模型的一部分。利用此框架,我们可以更容易地处理未见数据,并且得到较为准确的高斯过程似然估计结果。
Apr, 2023
本文提出了一种基于概率模型的降维方法,通过在目标数据集和背景数据集之间寻找信号富集的模式,能够恢复目标数据集中潜在空间中的有趣结构,并可应用于去噪、特征选择和子组发现等领域。
Nov, 2018
本文综述了一些线性降维方法,以及它们如何作为矩阵流形优化问题进行求解,并提出了一种基于正交投影的典型相关分析方法,这种优化框架使得线性降维成为了一种面向各种数据类型的黑盒子数值技术。
Jun, 2014
研究试验生命科学数据分析中的维度缩减技术及其数学原理。
Mar, 2014
通过提出非线性动力系统对移动 Agent 的形成控制来进行低维度表示,该系统由两部分组成:控制邻近点以解决局部结构问题和控制远程点以解决全局结构问题。数值实验在合成和真实数据集上进行,与现有模型进行比较表明所提出模型的稳固性和有效性。
Apr, 2024
本文表明一个特定结构的随机矩阵在降维方面类似于随机高斯矩阵,并且包括一些可以对矩阵 - 向量乘法进行 O (log n) 次计算的矩阵,从而提供了一种有效的通用集降维方法。通过连接任何集降维并使用链式论证将其连接到稀疏向量的降维,我们表明使用此类矩阵可以将高维度的任何集嵌入到较低的维度中,并且失真非常小。
Jun, 2015
使用优化运输工具把无监督学习、降维和聚类统一到一个框架中,解决聚类和降维的优化问题,通过实验验证了该方法在图像和基因组数据集上的卓越性能。
Feb, 2024
本论文从理论和算法的角度探讨了在不确定性下的非线性降维问题。为了建模每个样本的不确定性,提出了一个新的降维框架 NGEU,它利用了概率分布来描述输入样本空间。通过分析 Rademacher 复杂度,论证了该方法在处理不确定数据时具有较强的泛化能力。
Feb, 2022