使用 GTSNE 可视化数据
本论文提出了 GraphTSNE 其中,结合了图结构和节点特征来产生可视化结果,采用可伸缩和无监督的图卷积网络来训练修改后的 t-SNE 损失函数, 并在三个基准数据集上证明了其产生可取的可视化结果。
Apr, 2019
本文对 t-SNE 算法的理论框架进行了研究,在梯度下降法的基础上提出了一种新的理论框架;对于 t-SNE 的 embedding 阶段,文中还对其低维映射的运动学进行了表征和说明。通过本文,我们发现了 t-SNE 的内在机制并说明其在可视化聚类数据方面具有非凡的实用性。
May, 2021
本文提出了一种叫做 LargeVis 的技术,旨在解决将大规模和高维数据可视化在低维空间的问题。与 t-SNE 相比,LargeVis 构建精确近似的 K 最近邻图的计算成本更低,并采用了一个原则上的概率模型来进行可视化,整个过程易于扩展到数百万个高维数据点。实验结果表明,LargeVis 在效率和效果方面均优于现有的先进方法。
Feb, 2016
通过建立数据可视化形式的二维嵌入来正确地分离数据簇,使用 t-SNE 启发式的数据可视化方法在广泛的应用场景中成为事实上的标准,该研究提供了一种正式框架和分析,以分析数据可视化问题下 t-SNE 的性能表现,并且在满足特定条件时能部分恢复聚类结构。
Mar, 2018
本文介绍了一种基于降维的新颖图形可视化方法,称为 t-SGNE。t-SGNE 专门设计用于可视化图中的聚类结构,并通过使用图的邻居结构将时间复杂度从二次降低到线性的方式,支持更大规模的图。此外,结合拉普拉斯特征图嵌入算法和图中的最短路径算法形成了图嵌入算法 SPLEE,可以在 5 分钟内对具有 300K 节点和 1M 边缘的图进行可视化,且可视化质量提升约 10%。
Oct, 2023
该论文引入了 t-SNE-CUDA,它是一种 GPU 加速的 t 分布对称邻域嵌入(t-SNE)实现,用于可视化数据集和模型。t-SNE-CUDA 在图像和自然语言处理领域的数据集上实现了 50-700 倍的速度提升,从而实现了对整个 ImageNet 数据集的神经网络激活的可视化,并展示了 GloVe 嵌入向量的可视化效果。
Jul, 2018
本论文介绍了一种名为 FIt-SNE 的快速傅里叶变换加速插值 t-SNE 方法和 out-of-core PCA 方法,这些方法可以加速 t-SNE 的计算,并允许在资源有限的计算机上计算大型数据集的 t-SNE。
Dec, 2017
我们提出了两个互补的、方向感知的损失项,用于优化 t-SNE 的目标函数,强调数据的时间属性,指导优化和生成的嵌入结果,以显示出可能被忽略的时间模式。通过促进定向边的局部方向性,我们的方法产生了更具有时间意义且不那么混乱的可视化结果。
Mar, 2024
本文介绍了 t-SNE 算法的核化版本,能够将高维数据映射到低维空间并在非欧几里德度量下保留数据点之间的成对距离,可以通过仅在高维空间或在两个空间中使用核技巧来实现,提供了数据点之间关系的新视角,改进了包括使用核方法的分类问题的性能和准确性,并利用多个数据集阐明了 t-SNE 和其核化版本之间的区别,展示了不同类别点的更整洁的聚类。
Jul, 2023
本文提出了一种基于 vantage-point trees 的 t-SNE 实现算法,并使用 Barnes-Hut 算法来计算给出的高维数据点对之间的作用力,实验证明该算法相比于常规 t-SNE 具有更强的计算优势,且可以用于处理数据集建模任务。
Jan, 2013