利用方向感知的 t-SNE 可视化高维时序数据

Mar, 2024

利用方向感知的 t-SNE 可视化高维时序数据

Visualizing High-Dimensional Temporal Data Using Direction-Aware t-SNE

Pavlin G. Poličar, Blaž Zupan

TL;DR我们提出了两个互补的、方向感知的损失项，用于优化 t-SNE 的目标函数，强调数据的时间属性，指导优化和生成的嵌入结果，以显示出可能被忽略的时间模式。通过促进定向边的局部方向性，我们的方法产生了更具有时间意义且不那么混乱的可视化结果。

Abstract

Many real-world data sets contain a temporal component or involve transitions from state to state. For exploratory data analysis, we can represent these high-dimensional data sets in two-dimensional maps, using embeddings of the data objects under exploration and representing their temporal relationships with directed edges. Most existing →

temporal data dimensionality reduction t-sne embedding data visualization

发现论文，激发创造

数据可视化中 t-SNE 算法的分析

通过建立数据可视化形式的二维嵌入来正确地分离数据簇，使用 t-SNE 启发式的数据可视化方法在广泛的应用场景中成为事实上的标准，该研究提供了一种正式框架和分析，以分析数据可视化问题下 t-SNE 的性能表现，并且在满足特定条件时能部分恢复聚类结构。

Mar, 2018

t-SNE 可视化高维聚类数据的理论基础

本文对 t-SNE 算法的理论框架进行了研究，在梯度下降法的基础上提出了一种新的理论框架；对于 t-SNE 的 embedding 阶段，文中还对其低维映射的运动学进行了表征和说明。通过本文，我们发现了 t-SNE 的内在机制并说明其在可视化聚类数据方面具有非凡的实用性。

May, 2021

用对比学习进行监督式随机近邻嵌入

在保留数据集邻近信息的范围内，我们将自监督对比方法扩展到完全监督的设置，以有效利用标签信息。属于同一类别的样本集群在低维嵌入空间中聚集在一起，同时将不同类别的样本集群推开。

Sep, 2023

高效算法的 t - 分布随机邻域嵌入

本论文介绍了一种名为 FIt-SNE 的快速傅里叶变换加速插值 t-SNE 方法和 out-of-core PCA 方法，这些方法可以加速 t-SNE 的计算，并允许在资源有限的计算机上计算大型数据集的 t-SNE。

Dec, 2017

CO-SNE：超伪数据的降维与可视化

本文提出了 CO-SNE 将 Euclidean 空间降维工具 t-SNE 扩展到 hyperbolic 空间，采用超几何正态分布和超几何 Cauchy 分布，旨在保留数据点之间的距离和数据的超几何特性，经实验证明效果优于 PCA，t-SNE，UMAP 和 HoroPCA 等流行的可视化工具。

Nov, 2021

深度时空聚类：一种针对多维气候数据的时间聚类方法

利用 DSC 算法，结合 CNN-RNN 模型学习数据的空间和时间特征，通过聚类和数据重构误差优化来实现高维时空数据的无监督聚类，并在气候数据上的实验结果表明，该方法的效果要优于现有的无监督聚类算法。

Apr, 2023

t-SNE-CUDA: GPU 加速的 t-SNE 及其在现代数据中的应用

该论文引入了 t-SNE-CUDA，它是一种 GPU 加速的 t 分布对称邻域嵌入（t-SNE）实现，用于可视化数据集和模型。t-SNE-CUDA 在图像和自然语言处理领域的数据集上实现了 50-700 倍的速度提升，从而实现了对整个 ImageNet 数据集的神经网络激活的可视化，并展示了 GloVe 嵌入向量的可视化效果。

Jul, 2018

高维数据降维的层次最近邻图嵌入方法

提出了一种基于层次结构的 1 - 最近邻图的新方法，可以在保留数据分布多个级别的分组属性的同时，实现具有可解释机制、可视化品质高、运行速度快且可用于多种场景的非监督降维技术，并在不同规模、不同维度的多个数据集上进行了性能比较。

Mar, 2022

高效可视化大型图

本文介绍了一种基于降维的新颖图形可视化方法，称为 t-SGNE。t-SGNE 专门设计用于可视化图中的聚类结构，并通过使用图的邻居结构将时间复杂度从二次降低到线性的方式，支持更大规模的图。此外，结合拉普拉斯特征图嵌入算法和图中的最短路径算法形成了图嵌入算法 SPLEE，可以在 5 分钟内对具有 300K 节点和 1M 边缘的图进行可视化，且可视化质量提升约 10%。

Oct, 2023

可视化大规模高维数据

本文提出了一种叫做 LargeVis 的技术，旨在解决将大规模和高维数据可视化在低维空间的问题。与 t-SNE 相比，LargeVis 构建精确近似的 K 最近邻图的计算成本更低，并采用了一个原则上的概率模型来进行可视化，整个过程易于扩展到数百万个高维数据点。实验结果表明，LargeVis 在效率和效果方面均优于现有的先进方法。

Feb, 2016