可视化大规模高维数据

WWWFeb, 2016

Visualizing Large-scale and High-dimensional Data

Jian Tang, Jingzhou Liu, Ming Zhang, Qiaozhu Mei

TL;DR本文提出了一种叫做 LargeVis 的技术，旨在解决将大规模和高维数据可视化在低维空间的问题。与 t-SNE 相比，LargeVis 构建精确近似的 K 最近邻图的计算成本更低，并采用了一个原则上的概率模型来进行可视化，整个过程易于扩展到数百万个高维数据点。实验结果表明，LargeVis 在效率和效果方面均优于现有的先进方法。

Abstract

We study the problem of visualizing large-scale and high-dimensional data in a low-dimensional (typically 2D or 3D) space. Much success has been reported recently by techniques that first compute a similarity structure of the data points and then project them into a →

large-scale data visualization high-dimensional data low-dimensional space largevis k-nearest neighbor graph

发现论文，激发创造

NCVis：一种用于可扩展可视化的噪声对比方法

提出了一种基于噪声对比估计的高性能降维方法 NCVis，其在速度和表现质量方面优于现有技术，在处理自然语言的大数据集时速度也很快，可极大简化大规模数据分析并降低该领域的入门门槛。

Jan, 2020

高效可视化大型图

本文介绍了一种基于降维的新颖图形可视化方法，称为 t-SGNE。t-SGNE 专门设计用于可视化图中的聚类结构，并通过使用图的邻居结构将时间复杂度从二次降低到线性的方式，支持更大规模的图。此外，结合拉普拉斯特征图嵌入算法和图中的最短路径算法形成了图嵌入算法 SPLEE，可以在 5 分钟内对具有 300K 节点和 1M 边缘的图进行可视化，且可视化质量提升约 10%。

Oct, 2023

ShapeVis：大规模高维数据可视化

本文提出了一种基于拓扑数据分析的可扩展点云数据可视化技术 ——ShapeVis，通过构建数据流形上的加权见证图和从标准社区检测算法中引入的感应映射来压缩表示点云特征，并使用模块化方法剪枝和重建图形以总结数据的形状。与 Mapper 方法相比，我们的算法可以适用于成百万点数据的可视化展示。

Jan, 2020

t-SNE 可视化高维聚类数据的理论基础

本文对 t-SNE 算法的理论框架进行了研究，在梯度下降法的基础上提出了一种新的理论框架；对于 t-SNE 的 embedding 阶段，文中还对其低维映射的运动学进行了表征和说明。通过本文，我们发现了 t-SNE 的内在机制并说明其在可视化聚类数据方面具有非凡的实用性。

May, 2021

数据可视化中 t-SNE 算法的分析

通过建立数据可视化形式的二维嵌入来正确地分离数据簇，使用 t-SNE 启发式的数据可视化方法在广泛的应用场景中成为事实上的标准，该研究提供了一种正式框架和分析，以分析数据可视化问题下 t-SNE 的性能表现，并且在满足特定条件时能部分恢复聚类结构。

Mar, 2018

使用 GTSNE 可视化数据

GTSNE 是一种可视化高维数据点的新方法，通过捕捉数据的局部邻域结构和宏观结构来获得更好的可视化表现，并在广泛的数据集上展示了其性能优于 t-SNE 和 UMAP 等传统方法。

Aug, 2021

NeuroDAVIS：一种用于数据可视化的神经网络模型

本文介绍了一种名为 NeuroDAVIS 的无监督深度神经网络模型，用于高维数据的降维和可视化，该模型在大量合成和真实高维数据集上表现出了竞争力，特别是在保留数据大小、形状和本地全局结构方面。

Apr, 2023

GraphTSNE：一种用于图结构数据的可视化技术

本论文提出了 GraphTSNE 其中，结合了图结构和节点特征来产生可视化结果，采用可伸缩和无监督的图卷积网络来训练修改后的 t-SNE 损失函数，并在三个基准数据集上证明了其产生可取的可视化结果。

Apr, 2019

高维数据降维的层次最近邻图嵌入方法

提出了一种基于层次结构的 1 - 最近邻图的新方法，可以在保留数据分布多个级别的分组属性的同时，实现具有可解释机制、可视化品质高、运行速度快且可用于多种场景的非监督降维技术，并在不同规模、不同维度的多个数据集上进行了性能比较。

Mar, 2022

利用三元组实现更加全局准确的降维方法

我们展示了经常使用的降维方法，如 t-SNE 和 LargeVis，不能很好地捕捉低维度嵌入中数据的全局结构，并提出了一种名为 TriMap 的新方法，使用三元组信息来捕获更高级别的结构，通过实验证明 TriMap DR 结果具有明显的优势。

Mar, 2018