TriMap：使用三元组进行大规模降维

Oct, 2019

TriMap：使用三元组进行大规模降维

TriMap: Large-scale Dimensionality Reduction Using Triplets

Ehsan Amid, Manfred K. Warmuth

TL;DRTriMap 是一种基于三元组约束的降维技术，能够更好地保留数据的全局结构，相比 t-SNE、LargeVis 和 UMAP 等常用方法，它具有更快的运行时间和更好的簇相对位置，而且能够处理数百万个点。

Abstract

We introduce "trimap"; a dimensionality reduction technique based on triplet constraints, which preserves the global structure of the data better than the other commonly used methods such as t-SNE, LargeVis, and

trimap dimensionality reduction embedding cluster runtime

发现论文，激发创造

利用三元组实现更加全局准确的降维方法

我们展示了经常使用的降维方法，如 t-SNE 和 LargeVis，不能很好地捕捉低维度嵌入中数据的全局结构，并提出了一种名为 TriMap 的新方法，使用三元组信息来捕获更高级别的结构，通过实验证明 TriMap DR 结果具有明显的优势。

Mar, 2018

理解降维工具的工作原理：一种实证方法用于解析 t-SNE、UMAP、TriMAP 和 PaCMAP 进行数据可视化

本文旨在深入探讨降维方法中保留局部和全局结构的重要性，针对保留局部结构提出了一些新的设计原则，并发掘出保留哪些部分对于保持全局结构的重要性，在此基础上提出一种新的降维算法 PaCMAP，该算法同时保留了局部和全局结构，并为构建降维算法时提供了一些出乎意料的设计选择报告。

Dec, 2020

使用三元组网络进行深度度量学习

本文提出了三元组网络模型，通过距离比较来学习有用的表示方法，在多个数据集上的结果显示其比竞争对手孪生网络学习了更好的表示方法，而且还探讨了其作为无监督学习框架的未来可能用途。

Dec, 2014

归纳全局与局部流形逼近与投影

GLoMAP 及其归纳版本 iGLoMAP 是一种新颖的流形学习方法，用于非线性降维和高维数据可视化，能有效地保留局部和全局的距离估计，并通过优化过程逐步展示从全局到局部形成的进展。iGLoMAP 通过深度神经网络使得在未见过的数据点上能够提供低维嵌入而无需重新训练算法，并适用于小批量学习，以加快梯度计算速度。经过与当前最先进的方法进行竞争性实验，在模拟数据和真实数据环境下成功应用了 GLoMAP 和 iGLoMAP。

Jun, 2024

CBMAP：基于聚类的流形逼近和投影用于降维

介绍了一种基于聚类的降维方法 CBMAP，旨在同时保留全局和局部结构，提供速度、可扩展性和对超参数依赖较小的解决方案，满足机器学习应用中对测试数据的低维投影的需求。

Apr, 2024

经典降维的一种模型：UMAP 和 t-SNE 的概率视角

该论文表明降维方法 UMAP 和 t-SNE 可以近似重构为与 ProbDR 中引入的广义 Wishart 模型对应的 MAP 推断方法，这种解释不仅可以提供对这些算法更深入的理论洞察，还引入了研究类似降维方法的工具。

May, 2024

UMAP: 统一流形近似投影降维

UMAP 是一种基于黎曼几何和代数拓扑的流形学习技术，可以作为机器学习中通用的降维算法，具有与 t-SNE 相当的可视化质量和更好的整体结构保留能力，并且没有关于嵌入维度的计算限制。

Feb, 2018

高维数据降维的层次最近邻图嵌入方法

提出了一种基于层次结构的 1 - 最近邻图的新方法，可以在保留数据分布多个级别的分组属性的同时，实现具有可解释机制、可视化品质高、运行速度快且可用于多种场景的非监督降维技术，并在不同规模、不同维度的多个数据集上进行了性能比较。

Mar, 2022

大规模高维数据集的最小生成树可视化

本文介绍了一种新的数据可视化方法 TMAP，可将高维数据集表示为二维树，具有结构保持、透明性等优点，比 t-SNE 或 UMAP 更适用于化学、生物、物理等领域的数据集的探索和解释。

Aug, 2019

用于表征和半监督学习的参数化 UMAP 嵌入

本文介绍了一种基于 Riemannian 几何和代数拓扑的非参数图形降维算法 UMAP 及其通过神经网络权重进行参数优化以实现快速在线嵌入的拓展。研究进一步探索了 UMAP 作为正则化的应用，以捕获未标记数据中的结构，提高分类器的精度，并改善自编码器的潜在分布的全局结构保留。

Sep, 2020