可视化大规模高维数据
提出了一种基于噪声对比估计的高性能降维方法 NCVis,其在速度和表现质量方面优于现有技术,在处理自然语言的大数据集时速度也很快,可极大简化大规模数据分析并降低该领域的入门门槛。
Jan, 2020
本文介绍了一种基于降维的新颖图形可视化方法,称为 t-SGNE。t-SGNE 专门设计用于可视化图中的聚类结构,并通过使用图的邻居结构将时间复杂度从二次降低到线性的方式,支持更大规模的图。此外,结合拉普拉斯特征图嵌入算法和图中的最短路径算法形成了图嵌入算法 SPLEE,可以在 5 分钟内对具有 300K 节点和 1M 边缘的图进行可视化,且可视化质量提升约 10%。
Oct, 2023
本文提出了一种基于拓扑数据分析的可扩展点云数据可视化技术 ——ShapeVis,通过构建数据流形上的加权见证图和从标准社区检测算法中引入的感应映射来压缩表示点云特征,并使用模块化方法剪枝和重建图形以总结数据的形状。与 Mapper 方法相比,我们的算法可以适用于成百万点数据的可视化展示。
Jan, 2020
本文对 t-SNE 算法的理论框架进行了研究,在梯度下降法的基础上提出了一种新的理论框架;对于 t-SNE 的 embedding 阶段,文中还对其低维映射的运动学进行了表征和说明。通过本文,我们发现了 t-SNE 的内在机制并说明其在可视化聚类数据方面具有非凡的实用性。
May, 2021
通过建立数据可视化形式的二维嵌入来正确地分离数据簇,使用 t-SNE 启发式的数据可视化方法在广泛的应用场景中成为事实上的标准,该研究提供了一种正式框架和分析,以分析数据可视化问题下 t-SNE 的性能表现,并且在满足特定条件时能部分恢复聚类结构。
Mar, 2018
GTSNE 是一种可视化高维数据点的新方法,通过捕捉数据的局部邻域结构和宏观结构来获得更好的可视化表现,并在广泛的数据集上展示了其性能优于 t-SNE 和 UMAP 等传统方法。
Aug, 2021
本文介绍了一种名为 NeuroDAVIS 的无监督深度神经网络模型,用于高维数据的降维和可视化,该模型在大量合成和真实高维数据集上表现出了竞争力,特别是在保留数据大小、形状和本地全局结构方面。
Apr, 2023
本论文提出了 GraphTSNE 其中,结合了图结构和节点特征来产生可视化结果,采用可伸缩和无监督的图卷积网络来训练修改后的 t-SNE 损失函数, 并在三个基准数据集上证明了其产生可取的可视化结果。
Apr, 2019
提出了一种基于层次结构的 1 - 最近邻图的新方法,可以在保留数据分布多个级别的分组属性的同时,实现具有可解释机制、可视化品质高、运行速度快且可用于多种场景的非监督降维技术,并在不同规模、不同维度的多个数据集上进行了性能比较。
Mar, 2022
我们展示了经常使用的降维方法,如 t-SNE 和 LargeVis,不能很好地捕捉低维度嵌入中数据的全局结构,并提出了一种名为 TriMap 的新方法,使用三元组信息来捕获更高级别的结构,通过实验证明 TriMap DR 结果具有明显的优势。
Mar, 2018