高维数据降维的层次最近邻图嵌入方法
本文介绍了一种基于降维的新颖图形可视化方法,称为 t-SGNE。t-SGNE 专门设计用于可视化图中的聚类结构,并通过使用图的邻居结构将时间复杂度从二次降低到线性的方式,支持更大规模的图。此外,结合拉普拉斯特征图嵌入算法和图中的最短路径算法形成了图嵌入算法 SPLEE,可以在 5 分钟内对具有 300K 节点和 1M 边缘的图进行可视化,且可视化质量提升约 10%。
Oct, 2023
本文对 t-SNE 算法的理论框架进行了研究,在梯度下降法的基础上提出了一种新的理论框架;对于 t-SNE 的 embedding 阶段,文中还对其低维映射的运动学进行了表征和说明。通过本文,我们发现了 t-SNE 的内在机制并说明其在可视化聚类数据方面具有非凡的实用性。
May, 2021
本文研究了使用 PCA,t-SNE 和 UMAP 等降维技术对半监督图神经网络中节点标签的传播效果,并通过 Cora 和 Citeseer 等数据集进行了量化和定性分析,并发现在某些情况下,将降维技术应用于 GNN 的输入和输出可以同时提高半监督节点标签传播和节点聚类的有效性。
Mar, 2022
本研究提出了一种新型的节点嵌入方法,通过全局最小化成对相对熵和非线性的图地理路径,将每个节点编码为测量空间上的概率密度函数,并研究了其几何性质和有效的学习过程,实验结果表明,该方法在保留全局地理信息方面优于现有模型,并在无监督设置下在各种评估指标上表现出色。
May, 2019
本文介绍了 t-SNE 算法的核化版本,能够将高维数据映射到低维空间并在非欧几里德度量下保留数据点之间的成对距离,可以通过仅在高维空间或在两个空间中使用核技巧来实现,提供了数据点之间关系的新视角,改进了包括使用核方法的分类问题的性能和准确性,并利用多个数据集阐明了 t-SNE 和其核化版本之间的区别,展示了不同类别点的更整洁的聚类。
Jul, 2023
本文介绍了一种名为 NeuroDAVIS 的无监督深度神经网络模型,用于高维数据的降维和可视化,该模型在大量合成和真实高维数据集上表现出了竞争力,特别是在保留数据大小、形状和本地全局结构方面。
Apr, 2023
本文提出了一种叫做 LargeVis 的技术,旨在解决将大规模和高维数据可视化在低维空间的问题。与 t-SNE 相比,LargeVis 构建精确近似的 K 最近邻图的计算成本更低,并采用了一个原则上的概率模型来进行可视化,整个过程易于扩展到数百万个高维数据点。实验结果表明,LargeVis 在效率和效果方面均优于现有的先进方法。
Feb, 2016
通过建立数据可视化形式的二维嵌入来正确地分离数据簇,使用 t-SNE 启发式的数据可视化方法在广泛的应用场景中成为事实上的标准,该研究提供了一种正式框架和分析,以分析数据可视化问题下 t-SNE 的性能表现,并且在满足特定条件时能部分恢复聚类结构。
Mar, 2018
在保留数据集邻近信息的范围内,我们将自监督对比方法扩展到完全监督的设置,以有效利用标签信息。属于同一类别的样本集群在低维嵌入空间中聚集在一起,同时将不同类别的样本集群推开。
Sep, 2023
我们提出了 HMGE,一种基于分层聚合的高维多重图嵌入方法,通过学习图维度的分层组合和在每个层次进行嵌入的方式,揭示了多重图维度中隐藏的复杂信息和潜在结构,并通过局部补丁和全局摘要之间的互信息最大化来训练模型以捕捉图中处于不同位置但具有全局相关信息的能力。通过在合成和现实世界数据上进行的详细实验,我们证明了我们的方法在链接预测和节点分类等下游有监督任务中的适用性。
Dec, 2023