本文提出了一种叫做 LargeVis 的技术,旨在解决将大规模和高维数据可视化在低维空间的问题。与 t-SNE 相比,LargeVis 构建精确近似的 K 最近邻图的计算成本更低,并采用了一个原则上的概率模型来进行可视化,整个过程易于扩展到数百万个高维数据点。实验结果表明,LargeVis 在效率和效果方面均优于现有的先进方法。
Feb, 2016
本文介绍了一种名为 NeuroDAVIS 的无监督深度神经网络模型,用于高维数据的降维和可视化,该模型在大量合成和真实高维数据集上表现出了竞争力,特别是在保留数据大小、形状和本地全局结构方面。
Apr, 2023
提出了一种基于对比学习和邻居嵌入的新方法,称为 t-SimCNE,用于无监督可视化图像数据,并在 CIFAR-10 和 CIFAR-100 数据集上展示了信息丰富的聚类结构和异常值。
Oct, 2022
本文提出了一种基于拓扑数据分析的可扩展点云数据可视化技术 ——ShapeVis,通过构建数据流形上的加权见证图和从标准社区检测算法中引入的感应映射来压缩表示点云特征,并使用模块化方法剪枝和重建图形以总结数据的形状。与 Mapper 方法相比,我们的算法可以适用于成百万点数据的可视化展示。
Jan, 2020
通过建立数据可视化形式的二维嵌入来正确地分离数据簇,使用 t-SNE 启发式的数据可视化方法在广泛的应用场景中成为事实上的标准,该研究提供了一种正式框架和分析,以分析数据可视化问题下 t-SNE 的性能表现,并且在满足特定条件时能部分恢复聚类结构。
Mar, 2018
本文介绍了 VizNet,它是一个包含了超过 3100 万个数据集的大规模语料库,从开放数据库和在线可视化画廊中编译而来。它提供了一个必要的公共基线,用于比较可视化的设计技术,并为自动化可视化分析开发基准模型和算法。我们展示了如何从实验结果中学习知觉有效性度量,并展示了它在测试数据集上的预测能力。
May, 2019
提出了一种基于层次结构的 1 - 最近邻图的新方法,可以在保留数据分布多个级别的分组属性的同时,实现具有可解释机制、可视化品质高、运行速度快且可用于多种场景的非监督降维技术,并在不同规模、不同维度的多个数据集上进行了性能比较。
Mar, 2022
DimVis 是一个利用监督可解释的增强机器模型的可视化工具,通过交互式探索 UMAP 投影来提供高维数据分析的特征相关性解释,在转化复杂数据集为简单视觉表示时,增加了解释性,并解决了引入人为失真和解释性问题的困扰。
Feb, 2024
在保留数据集邻近信息的范围内,我们将自监督对比方法扩展到完全监督的设置,以有效利用标签信息。属于同一类别的样本集群在低维嵌入空间中聚集在一起,同时将不同类别的样本集群推开。
Sep, 2023
本论文提出了 GraphTSNE 其中,结合了图结构和节点特征来产生可视化结果,采用可伸缩和无监督的图卷积网络来训练修改后的 t-SNE 损失函数, 并在三个基准数据集上证明了其产生可取的可视化结果。
Apr, 2019