- 归纳全局与局部流形逼近与投影
GLoMAP 及其归纳版本 iGLoMAP 是一种新颖的流形学习方法,用于非线性降维和高维数据可视化,能有效地保留局部和全局的距离估计,并通过优化过程逐步展示从全局到局部形成的进展。iGLoMAP 通过深度神经网络使得在未见过的数据点上能够 - 经典降维的一种模型:UMAP 和 t-SNE 的概率视角
该论文表明降维方法 UMAP 和 t-SNE 可以近似重构为与 ProbDR 中引入的广义 Wishart 模型对应的 MAP 推断方法,这种解释不仅可以提供对这些算法更深入的理论洞察,还引入了研究类似降维方法的工具。
- 基于稀疏注意力回归网络的土壤肥力预测
使用 UMAP 和 LASSO 的混合方法,通过整合不均衡数据集中相关特征来改进土壤肥力模型的预测精度。实验结果显示该模型表现出色,达到了 98% 的预测准确度,以及 91.25% 的精确度和 90.90% 的召回率。
- DimVis:可解释的增强机构在降维中解释视觉聚类
DimVis 是一个利用监督可解释的增强机器模型的可视化工具,通过交互式探索 UMAP 投影来提供高维数据分析的特征相关性解释,在转化复杂数据集为简单视觉表示时,增加了解释性,并解决了引入人为失真和解释性问题的困扰。
- 在生物医学分割中探索基于熵和代表性采样的混合模型中的 UMAP
本研究探讨了在医学分割的主动学习领域中,熵和代表性采样技术的混合模型,特别是研究了 UMAP(均匀流形逼近和投影)作为捕捉代表性的技术的作用。通过在医学分割十项挑战中使用心脏和前列腺数据集进行验证,我们发现新颖的熵 - UMAP 采样技术的 - 一种新的双流时频对比预训练任务框架用于睡眠阶段分类
利用自我监督学习解决了许多有监督方法所面临的大量注释数据的需求,本研究在时域和频域中引入了双流预训练任务架构,并在睡眠阶段分类任务中通过引入频率相似性预训练任务,成功地提高了任务精度,并得到了具有意义信息的学习嵌入表示。
- 应用拓扑非负矩阵分解分析单细胞 RNA 测序
通过引入顶 ological NMF 和 robust topological NMF 方法,并利用 12 个数据集进行验证,我们证明了提出的 TNMF 和 rTNMF 明显优于其他基于 NMF 的方法,并在可视化中使用 TNMF 和 rT - 用对比学习进行监督式随机近邻嵌入
在保留数据集邻近信息的范围内,我们将自监督对比方法扩展到完全监督的设置,以有效利用标签信息。属于同一类别的样本集群在低维嵌入空间中聚集在一起,同时将不同类别的样本集群推开。
- 使用 CCP 辅助的 UMAP 和 t-SNE 分析 scRNA-seq 数据
本文介绍了一种基于相关聚类和投影的处理单细胞 RNA 测序(scRNA-seq)数据的方法,并将其用作降维工具,可显著改善 UMAP 和 t-SNE 二维可视化和准确性。
- 不可解释的解释:解读 tSNE 和 UMAP 的嵌入
研究在神经网络中应用降维方法 tSNE 和 UMAP 时出现的假设,证明 ARDR 算法一定会收敛并探讨如何从 2D 的表现推回模型的原输入分布。
- ActUp:分析和合并 tSNE 和 UMAP
本文通过对 tSNE 和 UMAP 算法中的参数空间进行理论和实证研究,发现仅有的一个参数 -- 规范化参数,可以在两个算法之间进行切换,而不会对嵌入产生任何影响。基于此,提出一种方法(ourmethod)结合 tSNE 和 UMAP 的技 - NeuroDAVIS:一种用于数据可视化的神经网络模型
本文介绍了一种名为 NeuroDAVIS 的无监督深度神经网络模型,用于高维数据的降维和可视化,该模型在大量合成和真实高维数据集上表现出了竞争力,特别是在保留数据大小、形状和本地全局结构方面。
- ICLR对图像数据集进行对比学习无监督可视化
提出了一种基于对比学习和邻居嵌入的新方法,称为 t-SimCNE,用于无监督可视化图像数据,并在 CIFAR-10 和 CIFAR-100 数据集上展示了信息丰富的聚类结构和异常值。
- GiDR-DUN; 梯度降维 —— 差异和统一
本文提出了一种新的降维算法 GDR,该算法结合了 TSNE 和 UMAP 算法的优点,可以通过改变标准化参数来实现对两种算法结果的复制,并且优化速度相较于现有算法更快。
- ICLR从 t-SNE 到 UMAP 的对比学习技术
本文分析并揭示了可视化高维数据的两种标准方法 t-SNE 和 UMAP 之间的联系,并提出了一种新的基于对比学习的方式来通用这两种方法,使得在嵌入中移动的过程可以在局部 / 离散和全局 / 连续结构之间进行权衡。
- 婴儿和成人语音声学的低维表示
该研究利用机器学习方法,提取婴儿和照顾者的声音,通过 UMAP 算法在二维空间中获得连续和良好分布的空间,研究发现随着婴儿年龄的增加,婴儿声音在二维空间中的分散度会增加以及婴儿声音与成人声音的相似度也会随婴儿年龄的变化而变化。
- AAAI使用 UMAP 进行聚类:连通性的重要性及其原因
本研究通过深入研究 UMAP,通过对 4 个标准图像和文本数据集的大量消融研究,发现互相 k 最近邻和最小生成树相结合的更精细的连通性概念以及构建局部邻域的灵活方法,可以比默认 UMAP 更好地实现降维,并通过下游聚类性能进行评估。
- 关于 UMAP 真实损失函数的研究
本研究针对 UMAP 在高维数据可视化方面超越 t-SNE 等方法的原因进行了详细调查,并推导出了 UMAP 的有效损失函数,发现它不同于已发表的损失函数。我们认为 UMAP 的成功关键在于其负采样实现的引力和斥力的平衡,并通过梯度下降法进 - 理解降维工具的工作原理:一种实证方法用于解析 t-SNE、UMAP、TriMAP 和 PaCMAP 进行数据可视化
本文旨在深入探讨降维方法中保留局部和全局结构的重要性,针对保留局部结构提出了一些新的设计原则,并发掘出保留哪些部分对于保持全局结构的重要性,在此基础上提出一种新的降维算法 PaCMAP,该算法同时保留了局部和全局结构,并为构建降维算法时提供 - 用于表征和半监督学习的参数化 UMAP 嵌入
本文介绍了一种基于 Riemannian 几何和代数拓扑的非参数图形降维算法 UMAP 及其通过神经网络权重进行参数优化以实现快速在线嵌入的拓展。研究进一步探索了 UMAP 作为正则化的应用,以捕获未标记数据中的结构,提高分类器的精度,并改