- 归纳全局与局部流形逼近与投影
GLoMAP 及其归纳版本 iGLoMAP 是一种新颖的流形学习方法,用于非线性降维和高维数据可视化,能有效地保留局部和全局的距离估计,并通过优化过程逐步展示从全局到局部形成的进展。iGLoMAP 通过深度神经网络使得在未见过的数据点上能够 - 经典降维的一种模型:UMAP 和 t-SNE 的概率视角
该论文表明降维方法 UMAP 和 t-SNE 可以近似重构为与 ProbDR 中引入的广义 Wishart 模型对应的 MAP 推断方法,这种解释不仅可以提供对这些算法更深入的理论洞察,还引入了研究类似降维方法的工具。
- 利用方向感知的 t-SNE 可视化高维时序数据
我们提出了两个互补的、方向感知的损失项,用于优化 t-SNE 的目标函数,强调数据的时间属性,指导优化和生成的嵌入结果,以显示出可能被忽略的时间模式。通过促进定向边的局部方向性,我们的方法产生了更具有时间意义且不那么混乱的可视化结果。
- S+t-SNE - 将降维应用于数据流
我们介绍了一种名为 S+t-SNE 的 t-SNE 算法的改进版本,它专门用于处理无限数据流,通过在新数据到达时增量更新 t-SNE 嵌入,保证了可扩展性和适应流式场景的能力,使用盲目方法进行漂移管理,调整嵌入空间,实现对不断演变的数据动态 - DimVis:可解释的增强机构在降维中解释视觉聚类
DimVis 是一个利用监督可解释的增强机器模型的可视化工具,通过交互式探索 UMAP 投影来提供高维数据分析的特征相关性解释,在转化复杂数据集为简单视觉表示时,增加了解释性,并解决了引入人为失真和解释性问题的困扰。
- 关于 t-SNE 在流形上的点云梯度流收敛分析
我们提出了关于 t-SNE 算法有限性的理论基础。t-SNE 使用梯度下降迭代与 Kullback-Leibler(KL)散度作为目标函数,旨在在高维空间中识别与原始数据点相似的一组点,最小化 KL 散度。在对采样数据集进行弱收敛假设的条件 - 用对比学习进行监督式随机近邻嵌入
在保留数据集邻近信息的范围内,我们将自监督对比方法扩展到完全监督的设置,以有效利用标签信息。属于同一类别的样本集群在低维嵌入空间中聚集在一起,同时将不同类别的样本集群推开。
- 核 t 分布随机邻域嵌入
本文介绍了 t-SNE 算法的核化版本,能够将高维数据映射到低维空间并在非欧几里德度量下保留数据点之间的成对距离,可以通过仅在高维空间或在两个空间中使用核技巧来实现,提供了数据点之间关系的新视角,改进了包括使用核方法的分类问题的性能和准确性 - 使用 CCP 辅助的 UMAP 和 t-SNE 分析 scRNA-seq 数据
本文介绍了一种基于相关聚类和投影的处理单细胞 RNA 测序(scRNA-seq)数据的方法,并将其用作降维工具,可显著改善 UMAP 和 t-SNE 二维可视化和准确性。
- 使用 t-SNE 可视化的 GAN 生成手写图像与 MNIST 图像的比较研究
本研究对使用 MNIST 数据集训练的 GAN 生成图像的质量进行了探究,使用 t-SNE 可视化比较生成图像与原始图像的差异并提出了一种实用的评估方法。
- NeuroDAVIS:一种用于数据可视化的神经网络模型
本文介绍了一种名为 NeuroDAVIS 的无监督深度神经网络模型,用于高维数据的降维和可视化,该模型在大量合成和真实高维数据集上表现出了竞争力,特别是在保留数据大小、形状和本地全局结构方面。
- ICLR对图像数据集进行对比学习无监督可视化
提出了一种基于对比学习和邻居嵌入的新方法,称为 t-SimCNE,用于无监督可视化图像数据,并在 CIFAR-10 和 CIFAR-100 数据集上展示了信息丰富的聚类结构和异常值。
- ICLR从 t-SNE 到 UMAP 的对比学习技术
本文分析并揭示了可视化高维数据的两种标准方法 t-SNE 和 UMAP 之间的联系,并提出了一种新的基于对比学习的方式来通用这两种方法,使得在嵌入中移动的过程可以在局部 / 离散和全局 / 连续结构之间进行权衡。
- KDDWasserstein t-SNE
本文介绍了一种使用 Wasserstein 距离度量内部分布形状的探索性层次数据集分析方法,并使用 t-SNE 构建了两维嵌入空间,以揭示 2017 年德国议会选举数据中分区与投票站之间的有意义结构。
- AAAI使用 UMAP 进行聚类:连通性的重要性及其原因
本研究通过深入研究 UMAP,通过对 4 个标准图像和文本数据集的大量消融研究,发现互相 k 最近邻和最小生成树相结合的更精细的连通性概念以及构建局部邻域的灵活方法,可以比默认 UMAP 更好地实现降维,并通过下游聚类性能进行评估。
- 使用 GTSNE 可视化数据
GTSNE 是一种可视化高维数据点的新方法,通过捕捉数据的局部邻域结构和宏观结构来获得更好的可视化表现,并在广泛的数据集上展示了其性能优于 t-SNE 和 UMAP 等传统方法。
- t-SNE 可视化高维聚类数据的理论基础
本文对 t-SNE 算法的理论框架进行了研究,在梯度下降法的基础上提出了一种新的理论框架;对于 t-SNE 的 embedding 阶段,文中还对其低维映射的运动学进行了表征和说明。通过本文,我们发现了 t-SNE 的内在机制并说明其在可视 - 关于 UMAP 真实损失函数的研究
本研究针对 UMAP 在高维数据可视化方面超越 t-SNE 等方法的原因进行了详细调查,并推导出了 UMAP 的有效损失函数,发现它不同于已发表的损失函数。我们认为 UMAP 的成功关键在于其负采样实现的引力和斥力的平衡,并通过梯度下降法进 - 理解降维工具的工作原理:一种实证方法用于解析 t-SNE、UMAP、TriMAP 和 PaCMAP 进行数据可视化
本文旨在深入探讨降维方法中保留局部和全局结构的重要性,针对保留局部结构提出了一些新的设计原则,并发掘出保留哪些部分对于保持全局结构的重要性,在此基础上提出一种新的降维算法 PaCMAP,该算法同时保留了局部和全局结构,并为构建降维算法时提供 - 邻居嵌入中的吸引 - 排斥谱
本研究介绍了邻居嵌入算法族,针对不同的连续流形结构和离散聚类结构之间的权衡关系,以 $t-SNE$ 为例,通过夸张参数来调节吸引力与排斥力之间的平衡,得到了一系列的嵌入,UMAP 算法通过负采样策略降低有效排斥,较高的吸引力偏重于表达连续流