Barnes-Hut-SNE

Jan, 2013

Laurens van der Maaten

TL;DR本文提出了一种基于 vantage-point trees 的 t-SNE 实现算法，并使用 Barnes-Hut 算法来计算给出的高维数据点对之间的作用力，实验证明该算法相比于常规 t-SNE 具有更强的计算优势，且可以用于处理数据集建模任务。

Abstract

The paper presents an O(N log N)-implementation of t-sne -- an embedding technique that is commonly used for the visualization of high-dimensional data in scatter plots and that normally runs in O(N^2). The new i

t-sne embedding vantage-point trees barnes-hut algorithm computational advantage

发现论文，激发创造

t-SNE 可视化高维聚类数据的理论基础

本文对 t-SNE 算法的理论框架进行了研究，在梯度下降法的基础上提出了一种新的理论框架；对于 t-SNE 的 embedding 阶段，文中还对其低维映射的运动学进行了表征和说明。通过本文，我们发现了 t-SNE 的内在机制并说明其在可视化聚类数据方面具有非凡的实用性。

May, 2021

核 t 分布随机邻域嵌入

本文介绍了 t-SNE 算法的核化版本，能够将高维数据映射到低维空间并在非欧几里德度量下保留数据点之间的成对距离，可以通过仅在高维空间或在两个空间中使用核技巧来实现，提供了数据点之间关系的新视角，改进了包括使用核方法的分类问题的性能和准确性，并利用多个数据集阐明了 t-SNE 和其核化版本之间的区别，展示了不同类别点的更整洁的聚类。

Jul, 2023

高效算法的 t - 分布随机邻域嵌入

本论文介绍了一种名为 FIt-SNE 的快速傅里叶变换加速插值 t-SNE 方法和 out-of-core PCA 方法，这些方法可以加速 t-SNE 的计算，并允许在资源有限的计算机上计算大型数据集的 t-SNE。

Dec, 2017

数据可视化中 t-SNE 算法的分析

通过建立数据可视化形式的二维嵌入来正确地分离数据簇，使用 t-SNE 启发式的数据可视化方法在广泛的应用场景中成为事实上的标准，该研究提供了一种正式框架和分析，以分析数据可视化问题下 t-SNE 的性能表现，并且在满足特定条件时能部分恢复聚类结构。

Mar, 2018

t-SNE-CUDA: GPU 加速的 t-SNE 及其在现代数据中的应用

该论文引入了 t-SNE-CUDA，它是一种 GPU 加速的 t 分布对称邻域嵌入（t-SNE）实现，用于可视化数据集和模型。t-SNE-CUDA 在图像和自然语言处理领域的数据集上实现了 50-700 倍的速度提升，从而实现了对整个 ImageNet 数据集的神经网络激活的可视化，并展示了 GloVe 嵌入向量的可视化效果。

Jul, 2018

S+t-SNE - 将降维应用于数据流

我们介绍了一种名为 S+t-SNE 的 t-SNE 算法的改进版本，它专门用于处理无限数据流，通过在新数据到达时增量更新 t-SNE 嵌入，保证了可扩展性和适应流式场景的能力，使用盲目方法进行漂移管理，调整嵌入空间，实现对不断演变的数据动态的持续可视化，实验评估结果表明 S+t-SNE 的效果和效率，突出其在流式场景中捕捉模式的能力，我们希望该方法能为研究人员和实践者提供一种实时理解和解释高维数据的工具。

Mar, 2024

使用 GTSNE 可视化数据

GTSNE 是一种可视化高维数据点的新方法，通过捕捉数据的局部邻域结构和宏观结构来获得更好的可视化表现，并在广泛的数据集上展示了其性能优于 t-SNE 和 UMAP 等传统方法。

Aug, 2021

随机聚类嵌入

本文提出了一种基于邻域嵌入的新型集群可视化方法，使用非归一化 Kullback-Leibler 散度和缩放参数以进一步优化数据聚类的可视化效果。

Aug, 2021

高效可视化大型图

本文介绍了一种基于降维的新颖图形可视化方法，称为 t-SGNE。t-SGNE 专门设计用于可视化图中的聚类结构，并通过使用图的邻居结构将时间复杂度从二次降低到线性的方式，支持更大规模的图。此外，结合拉普拉斯特征图嵌入算法和图中的最短路径算法形成了图嵌入算法 SPLEE，可以在 5 分钟内对具有 300K 节点和 1M 边缘的图进行可视化，且可视化质量提升约 10%。

Oct, 2023

高维数据降维的层次最近邻图嵌入方法

提出了一种基于层次结构的 1 - 最近邻图的新方法，可以在保留数据分布多个级别的分组属性的同时，实现具有可解释机制、可视化品质高、运行速度快且可用于多种场景的非监督降维技术，并在不同规模、不同维度的多个数据集上进行了性能比较。

Mar, 2022