调整和计算基于采样的 t-SNE 嵌入的困惑度

Aug, 2023

调整和计算基于采样的 t-SNE 嵌入的困惑度

Tuning the perplexity for and computing sampling-based t-SNE embeddings

Martin Skrodzki, Nicolas Chaves-de-Plaza, Klaus Hildebrandt, Thomas Höllt, Elmar Eisemann

TL;DR在这篇论文中，我们提出了一种基于采样的嵌入方法，用于解决在分析高维数据时使用二维可视化技术会导致次优嵌入的问题。我们展示了如何根据采样率和预期的最终嵌入选择合适的超参数，并说明了这种方法如何加快计算速度并提高嵌入的质量。

Abstract

Widely used pipelines for the analysis of high-dimensional data utilize two-dimensional visualizations. These are created, e.g., via t-distributed stochastic neighbor embedding (t-SNE). When it comes to

high-dimensional data two-dimensional visualizations t-distributed stochastic neighbor embedding large data sets sampling-based embedding approach

发现论文，激发创造

t-SNE 可视化高维聚类数据的理论基础

本文对 t-SNE 算法的理论框架进行了研究，在梯度下降法的基础上提出了一种新的理论框架；对于 t-SNE 的 embedding 阶段，文中还对其低维映射的运动学进行了表征和说明。通过本文，我们发现了 t-SNE 的内在机制并说明其在可视化聚类数据方面具有非凡的实用性。

May, 2021

高效算法的 t - 分布随机邻域嵌入

本论文介绍了一种名为 FIt-SNE 的快速傅里叶变换加速插值 t-SNE 方法和 out-of-core PCA 方法，这些方法可以加速 t-SNE 的计算，并允许在资源有限的计算机上计算大型数据集的 t-SNE。

Dec, 2017

数据可视化中 t-SNE 算法的分析

通过建立数据可视化形式的二维嵌入来正确地分离数据簇，使用 t-SNE 启发式的数据可视化方法在广泛的应用场景中成为事实上的标准，该研究提供了一种正式框架和分析，以分析数据可视化问题下 t-SNE 的性能表现，并且在满足特定条件时能部分恢复聚类结构。

Mar, 2018

核 t 分布随机邻域嵌入

本文介绍了 t-SNE 算法的核化版本，能够将高维数据映射到低维空间并在非欧几里德度量下保留数据点之间的成对距离，可以通过仅在高维空间或在两个空间中使用核技巧来实现，提供了数据点之间关系的新视角，改进了包括使用核方法的分类问题的性能和准确性，并利用多个数据集阐明了 t-SNE 和其核化版本之间的区别，展示了不同类别点的更整洁的聚类。

Jul, 2023

S+t-SNE - 将降维应用于数据流

我们介绍了一种名为 S+t-SNE 的 t-SNE 算法的改进版本，它专门用于处理无限数据流，通过在新数据到达时增量更新 t-SNE 嵌入，保证了可扩展性和适应流式场景的能力，使用盲目方法进行漂移管理，调整嵌入空间，实现对不断演变的数据动态的持续可视化，实验评估结果表明 S+t-SNE 的效果和效率，突出其在流式场景中捕捉模式的能力，我们希望该方法能为研究人员和实践者提供一种实时理解和解释高维数据的工具。

Mar, 2024

t-SNE-CUDA: GPU 加速的 t-SNE 及其在现代数据中的应用

该论文引入了 t-SNE-CUDA，它是一种 GPU 加速的 t 分布对称邻域嵌入（t-SNE）实现，用于可视化数据集和模型。t-SNE-CUDA 在图像和自然语言处理领域的数据集上实现了 50-700 倍的速度提升，从而实现了对整个 ImageNet 数据集的神经网络激活的可视化，并展示了 GloVe 嵌入向量的可视化效果。

Jul, 2018

通过 t-SNE 镜头探索逐层的对抗性鲁棒性

我们提出了一种方法来评估图像分类人工神经网络的对抗鲁棒性，该方法利用 t-SNE 技术进行视觉检验，并且通过比较干净和扰动后的嵌入来确定网络中的弱点。通过对比两种不同的人类设计和神经进化设计的神经网络在 CIFAR-10 数据集上的分析，我们发现清晰和扰动表示之间的差异在特征提取层中就开始出现，并且影响后续的分类过程，这些结果得到了 t-SNE 图的视觉分析的支持。

Jun, 2024

利用方向感知的 t-SNE 可视化高维时序数据

我们提出了两个互补的、方向感知的损失项，用于优化 t-SNE 的目标函数，强调数据的时间属性，指导优化和生成的嵌入结果，以显示出可能被忽略的时间模式。通过促进定向边的局部方向性，我们的方法产生了更具有时间意义且不那么混乱的可视化结果。

Mar, 2024

Barnes-Hut-SNE

本文提出了一种基于 vantage-point trees 的 t-SNE 实现算法，并使用 Barnes-Hut 算法来计算给出的高维数据点对之间的作用力，实验证明该算法相比于常规 t-SNE 具有更强的计算优势，且可以用于处理数据集建模任务。

Jan, 2013

可视化大规模高维数据

本文提出了一种叫做 LargeVis 的技术，旨在解决将大规模和高维数据可视化在低维空间的问题。与 t-SNE 相比，LargeVis 构建精确近似的 K 最近邻图的计算成本更低，并采用了一个原则上的概率模型来进行可视化，整个过程易于扩展到数百万个高维数据点。实验结果表明，LargeVis 在效率和效果方面均优于现有的先进方法。

Feb, 2016