研究如何将主成分分析 (PCA) 推广到黎曼流形上,提出了一种新的子空间类型 —— 重心子空间,并将 PCA 重新表述为线性子空间族上的最优化问题,以构造具有 affine spans 的 Flag 的子空间层次嵌套来优化积累未解释方差 (AUV) 标准,在黎曼流形中进行最优的 PCA 推广 ——Barycentric Subspaces Analysis (BSA)。
Jul, 2016
该论文提出了一种代数几何解决从样本数据点分割未知数量和不同维度的子空间的问题的方法,并且使用一组次数为子空间数量的齐次多项式来表示子空间,并且在数据中线性估计这些多项式,从而将子空间分割降为每个子空间分类一个点,并且通过最小化某个距离函数从数据集中最优地选择这些点,然后应用标准 PCA 到导数(法向矢量)的集合来恢复每个子空间的补充基础,最后在多个仿射视图中从点对应中对 GPCA 的应用进行了探讨。
Feb, 2012
我们提出了一种两步传递学习算法,通过从多个主成分分析(PCA)研究中提取有用信息来增强目标 PCA 任务的估计精度,并对理论进行了分析,证明了在知识传递之后经验谱投影矩阵的双线性形式在较弱的特征值间隔条件下渐进地正态分布。
Mar, 2024
本文研究具有多台服务器的分布式计算环境,通过开发 PCA 算法来处理点集的低维子空间问题,进而解决异常检测以及聚类等计算问题,提出的新算法显著降低了 $k$-means 聚类与相关问题的计算以及通讯成本,并且经过实验验证,在解决方案质量方面具有忽略不计的退化。
Aug, 2014
本文探讨了机器学习领域中很多算法都需要从样本中估计一个线性子空间的问题,并针对不同的度量标准推导了新的学习误差估计方法,该方法还可以用于 PCA 和光谱支持估计的尖锐误差估计,是一种具有广泛适用性的光谱学习方法的算子理论方法的重要研究成果。
提出了一种基于矩阵草图的流式 Kernel 主成分分析方法,它能够在流中维护一小组基本元素,仅需要对 n 取对数的空间,比当前最先进的方法在实践中表现得更好。
Dec, 2015
本文介绍了一种基于 PCA 的新方法,用于估计具有非线性结构的数据的内在维数,该方法利用整个数据集估计其内在维数,并方便增量学习。该方法使用数据的最小覆盖来处理数据集的非线性结构,并通过检查所有小邻域区域的数据方差来确定估计结果。实验结果表明,该方法可以过滤数据中的噪声,并在邻域区域大小增加时收敛到稳定的估计值。
Feb, 2010
本研究概述了鲁棒子空间学习和跟踪领域。通过罕见因素加上低秩矩阵分解(S+LR),在存在异常值的情况下解决了罕见子空间学习或 PCA 问题,并发现针对长数据序列的跟踪鲁棒子空间的更好的模型是假设数据位于低维子空间中,而该模型的异常值被作为稀疏病态安装建模。
Nov, 2017
本文提出了一种基于 isotropic PCA 的 affine-invariant 聚类算法,该算法在混合模型输入的情况下有很强的保证力,特别是在对两个任意高斯混合的分类中结果最佳,对于超过两个的混合,只要存在一个低维度的子空间满足重叠很小的条件,即可得到良好的结果。
Apr, 2008
本文考虑了高维情况下主成分子空间的极小值估计和自适应估计,并利用聚合构建了速率最优估计器。同时介绍了一种通过降维来对稀疏主成分分析问题求解的方法。
Nov, 2012