UMAP: 统一流形近似投影降维

Feb, 2018

UMAP: Uniform Manifold Approximation and Projection for Dimension Reduction

Leland McInnes, John Healy, James Melville

TL;DRUMAP 是一种基于黎曼几何和代数拓扑的流形学习技术，可以作为机器学习中通用的降维算法，具有与 t-SNE 相当的可视化质量和更好的整体结构保留能力，并且没有关于嵌入维度的计算限制。

Abstract

umap (Uniform Manifold Approximation and Projection) is a novel manifold learning technique for dimension reduction. umap is constructed f

umap manifold learning dimension reduction riemannian geometry machine learning

发现论文，激发创造

CBMAP：基于聚类的流形逼近和投影用于降维

介绍了一种基于聚类的降维方法 CBMAP，旨在同时保留全局和局部结构，提供速度、可扩展性和对超参数依赖较小的解决方案，满足机器学习应用中对测试数据的低维投影的需求。

Apr, 2024

近似 UMAP 允许高速在线可视化高维数据流

在脑机接口领域，我们引入了一种名为近似 UMAP（aUMAP）的新方法，用于实时推断，其结果显示该方法能够在减少投影速度一个数量级的同时维持与标准 UMAP 相同的训练时间和投影空间。

Apr, 2024

归纳全局与局部流形逼近与投影

GLoMAP 及其归纳版本 iGLoMAP 是一种新颖的流形学习方法，用于非线性降维和高维数据可视化，能有效地保留局部和全局的距离估计，并通过优化过程逐步展示从全局到局部形成的进展。iGLoMAP 通过深度神经网络使得在未见过的数据点上能够提供低维嵌入而无需重新训练算法，并适用于小批量学习，以加快梯度计算速度。经过与当前最先进的方法进行竞争性实验，在模拟数据和真实数据环境下成功应用了 GLoMAP 和 iGLoMAP。

Jun, 2024

用于表征和半监督学习的参数化 UMAP 嵌入

本文介绍了一种基于 Riemannian 几何和代数拓扑的非参数图形降维算法 UMAP 及其通过神经网络权重进行参数优化以实现快速在线嵌入的拓展。研究进一步探索了 UMAP 作为正则化的应用，以捕获未标记数据中的结构，提高分类器的精度，并改善自编码器的潜在分布的全局结构保留。

Sep, 2020

流形增强：将混合正则化与 UMAP 结合

深度学习模型的数据增强技术在提高性能方面发挥重要作用。本文提出了一种叫做 UMAP Mixup 的混合正则化方案，用于深度学习预测模型的 “在流形上” 自动数据增强。该方法通过利用一种称为统一流形逼近和投影的降维技术，确保 Mixup 操作生成的合成样本位于特征和标签的数据流形上。对多样的回归任务的评估显示，UMAP Mixup 在与其他 Mixup 变种的竞争中表现出色，显示出改进深度学习模型泛化性能的潜力。

Dec, 2023

经典降维的一种模型：UMAP 和 t-SNE 的概率视角

该论文表明降维方法 UMAP 和 t-SNE 可以近似重构为与 ProbDR 中引入的广义 Wishart 模型对应的 MAP 推断方法，这种解释不仅可以提供对这些算法更深入的理论洞察，还引入了研究类似降维方法的工具。

May, 2024

理解降维工具的工作原理：一种实证方法用于解析 t-SNE、UMAP、TriMAP 和 PaCMAP 进行数据可视化

本文旨在深入探讨降维方法中保留局部和全局结构的重要性，针对保留局部结构提出了一些新的设计原则，并发掘出保留哪些部分对于保持全局结构的重要性，在此基础上提出一种新的降维算法 PaCMAP，该算法同时保留了局部和全局结构，并为构建降维算法时提供了一些出乎意料的设计选择报告。

Dec, 2020

在生物医学分割中探索基于熵和代表性采样的混合模型中的 UMAP

本研究探讨了在医学分割的主动学习领域中，熵和代表性采样技术的混合模型，特别是研究了 UMAP（均匀流形逼近和投影）作为捕捉代表性的技术的作用。通过在医学分割十项挑战中使用心脏和前列腺数据集进行验证，我们发现新颖的熵 - UMAP 采样技术的混合组合在 Dice 分数上显著优于随机基线（心脏为 3.2％，前列腺为 4.5％），并在我们研究的 10 种不同主动学习方法中获得了最高的 Dice 系数。这提供了初步证据表明，在混合主动学习模型中，熵和 UMAP 方法之间存在着有趣的协同作用，其中前者在后者之前起到了积极的作用。

Dec, 2023

通过流形逼近和投影实现的无监督句子嵌入

该研究提出了一种名为 EMAP 的新技术，通过将句子投射到一个固定维度的流形上，以保留原始空间中的局部邻域来无监督地生成句子嵌入，可以用于文本分类，实验证明该方法性能优于其他最先进方法。

Feb, 2021

基于随机森林保几何性质的监督流形学习

本文提出使用随机森林的数据几何保证变体作为流形学习方法的初始化，以实现具有意义的嵌入，并证明了使用这些相似度保持能够几乎适用于各种流形学习方法并且能够正确地维护全局结构。

Jul, 2023