- 天文学中的无监督学习综述
该综述论文总结了流行的无监督学习方法,并概述了这些方法在天文学中的过去、现在和未来的应用。无监督学习通过组织数据集的信息内容,以便能够提取知识。传统上,这是通过降维技术的实现,如主成分分析或使用自编码器,或者通过高维空间的简化可视化,例如使 - 基于数据驱动的面部表情编码系统(DFECS)的无监督学习使用关键点追踪
通过计算机视觉技术中的面部关键点跟踪,提出了一种基于数据驱动的面部表情编码系统(DFECS),通过引入稀疏性和正性约束的高级降维技术,可以自动估计面部运动中的行动单元并解释性强,进一步的研究可以加速面部表情分析在安全、医疗和娱乐等领域的应用 - 基于 Spherinator 和 HiPSter 的无偏知识发现的表示学习
通过非线性降维方法将模拟数据投影到低维空间,用于交互式检查、可视化解释、样本选择和局部分析,以获得天体物理学和宇宙学模拟的有用科学见解。
- 使用函数数据分析进行噪声数据可视化
数据可视化通过降维是探索性数据分析中的重要工具,本文提出了一种新的数据可视化方法叫做功能信息几何(FIG),该方法结合了经验内在几何(EIG)框架和功能数据分析,以解决维度灾难问题,并在捕捉真实结构、超参数稳健性和计算速度方面优于 EIG - 物联网应用中符号聚合近似的性能评估
基于 SAX 算法,本文提出了一种降维和形状识别方法,旨在解决物联网等应用中 SAX 算法的计算开销问题,通过降低维度空间的同时捕获和保留形状的最具代表性的特征,实验证明了这种方法在性能特性方面的优势。
- 经典降维的一种模型:UMAP 和 t-SNE 的概率视角
该论文表明降维方法 UMAP 和 t-SNE 可以近似重构为与 ProbDR 中引入的广义 Wishart 模型对应的 MAP 推断方法,这种解释不仅可以提供对这些算法更深入的理论洞察,还引入了研究类似降维方法的工具。
- 核最大切片 Wasserstein 距离的统计和计算保证
通过找到一种优化非线性映射,将数据降维到一维后计算 Wasserstein 距离,本文提供了 KMS p-Wasserstein 距离的尖锐有限样本保证,并给出了计算 KMS 2-Wasserstein 距离的难度和仿真实验的表现。
- 降秩自编码器 —— 增强非线性流形上的插值
我们介绍了 Rank Reduction Autoencoder (RRAE),这是一个具有扩展的潜在空间的自编码器,通过约束具有小的预定主奇异值数量(即低秩)来实现。RRAE 的潜在空间足够大,可以实现准确的预测,并进行特征提取。
- 形状优化设计空间维度缩减方法调查
工程设计中的功能表面维度缩减技术对形状优化进行了详尽的回顾,从经典的线性方法(如主成分分析)到非线性方法(如自动编码器),再到集成物理数据的创新物理感知方法,探讨了这些技术的光谱。通过将这些方法整合到优化框架中,显示它们显著减轻了维度的困扰 - 利用领域知识探索 UMAP 投影的镜头函数
基于 Mapper 和 STAD 的灵感,本文针对 UMAP 提出了三种类型的镜头函数,用于领域知识引导的交互式探索,以实现将高维数据投影到二维空间并显示隐藏模式的目的。通过使用镜头函数,分析人员可以根据问题调整投影,揭示不可见的模式,并通 - 梯度提升映射用于降维与特征提取
我们提出了一种监督降维方法 Gradient Boosting Mapping (GBMAP),其通过一层感知器定义的弱学习器的输出来定义嵌入,从而为监督学习任务提供更好的特征,使得简单线性模型能够与最先进的回归器和分类器相竞争,并能够自动 - 可扩展的分摊 GPLVMs 用于单细胞转录组学数据
通过改进的压缩随机变分贝叶斯 GPLVM 模型,我们成功实现了对单细胞 RNA-seq 数据的解释性降维分析,该模型在细胞类型聚类、细胞周期和批次信息的加入等方面表现出相当高的效果,并通过应用于先天免疫数据集验证了更可解释的潜在结构。
- 生成对抗学习中的最佳输入维度和自适应生成器架构
通过广义生成对抗网络(G-GANs)框架中引入的群惩罚和体系结构惩罚的方法,我们研究了输入维度对生成对抗网络(GANs)泛化误差的影响,发现存在一种最优输入维度(OID)可以最小化泛化误差,而通过降维和生成器网络结构的自动调整,G-GANs - 非负矩阵分解在降维中的应用:一项综述
本文综述了非负矩阵分解(NMF)在降维中的应用,重点关注其在特征提取和特征选择方面。我们分类了降维方法,对 NMF 的不同方法进行了全面总结。此外,我们讨论了 NMF 在降维中的最新研究趋势和潜在未来发展方向,旨在突出需要进一步探索和发展的 - GAD:一种具有在线自适应学习的实时步态异常检测系统
通过降维和长短时记忆(LSTM)方法,该论文引入了 GAD(实时步态异常检测系统),用于在三维加速度计读数中检测个人的异常步态,并通过在线学习自适应于细微模式变化,实现了较高的检测准确率。
- 基于最后卷积层输出的高维特征子空间投影的异常检测
这篇论文集中在最后的卷积层输出的高维特征上,通过将这些高维特征投影到两个具体的特征子空间,借助网络的线性层的降维能力来识别产生在训练分布之外的数据,从而实现可靠的模式分类检测。我们的方法不需要输入预处理或特定的数据预调优,通过修改全连接层之 - CBMAP:基于聚类的流形逼近和投影用于降维
介绍了一种基于聚类的降维方法 CBMAP,旨在同时保留全局和局部结构,提供速度、可扩展性和对超参数依赖较小的解决方案,满足机器学习应用中对测试数据的低维投影的需求。
- 使用神经隐式流来表示规范系统的潜在动态
研究了 Neural Operators 中的 Neural Implicit Flow 对经典系统的潜在动力学建模和动态相关信息提取的能力,并通过与 Deep Operator Networks 的比较分析,评估了其作为降维算法的适用性。
- 非线性自编码器潜空间分析中的解码器分解与风洞实验数据
利用解码器分解方法进行介电解释和相关的涡流结构的等级和选择过程,以帮助用户设计和解释非线性自动编码器。
- 跨时间频谱自编码器(CTSAE):用于聚类引力波故障的无监督降维
利用 Cross-Temporal Spectrogram Autoencoder (CTSAE) 这一无监督方法进行 LIGO 数据的降维和聚类,相较于半监督学习方法,在主通道上训练和评估的 CTSAE 模型在聚类任务中展现出卓越的性能,