基于随机森林保几何性质的监督流形学习

Jul, 2023

基于随机森林保几何性质的监督流形学习

Supervised Manifold Learning via Random Forest Geometry-Preserving Proximities

Jake S. Rhodes

TL;DR本文提出使用随机森林的数据几何保证变体作为流形学习方法的初始化，以实现具有意义的嵌入，并证明了使用这些相似度保持能够几乎适用于各种流形学习方法并且能够正确地维护全局结构。

Abstract

manifold learning approaches seek the intrinsic, low-dimensional data structure within a high-dimensional space. Mainstream manifold learning algorithms, such as Isomap, UMAP, $t$-SNE, Diffusion Map, and Laplacia

manifold learning unsupervised learning supervised learning dimensionality reduction random forest

发现论文，激发创造

归纳全局与局部流形逼近与投影

GLoMAP 及其归纳版本 iGLoMAP 是一种新颖的流形学习方法，用于非线性降维和高维数据可视化，能有效地保留局部和全局的距离估计，并通过优化过程逐步展示从全局到局部形成的进展。iGLoMAP 通过深度神经网络使得在未见过的数据点上能够提供低维嵌入而无需重新训练算法，并适用于小批量学习，以加快梯度计算速度。经过与当前最先进的方法进行竞争性实验，在模拟数据和真实数据环境下成功应用了 GLoMAP 和 iGLoMAP。

Jun, 2024

基於改進的擴散映射的流形正則化分類模型

该论文提出了一种基于标签传播模型改进流形正则化的方法，通过增强扩散图算法的概率转移矩阵来描述流形上的标签传播过程，并证明了扩展的标签传播函数在足够长时间后收敛到稳定分布，成为一个可用的分类器，实验证明了该方法的优越性。

Mar, 2024

通过自编码器和随机森林相似性提升监督可视化的样本外扩展

通过结合随机森林模型和自编码器的功能学习能力，我们为基于随机森林的监督降维方法 RF-PHATE 提供了一种新的样本外扩展方法，并通过定量评估不同自编码器结构，发现了用于嵌入扩展问题的网络结构，进一步地，通过利用基于邻近性的原型，我们在不降低扩展质量的情况下实现了 40% 的训练时间的减少。我们的方法不需要样本外样本的标签信息，因此作为半监督方法，并且仅使用 10% 的训练数据也可以获得一致的质量。

Jun, 2024

具有几何正则化的可扩展和可逆流形学习自编码器

本文提出了一种基于自动编码器与流形学习结合的数据探索方法，利用几何正则化项鼓励学习得到的潜在表示沿着数据的内在几何结构发展，并与常规方法相比较，证明该方法在保留内在结构、扩展能力和数据重构方面具有优势

Jul, 2020

Grassmann 流形的局部保持投影

本文提出了一种基于局部保持投影（LPP）准则的 Grassmann 流形领域内的无监督降维算法，通过将高维 Grassmann 流形映射到具有更具有判别能力的相对低维流形的方式，可以显著减小计算成本并提高分类和聚类任务的性能。

Apr, 2017

深度度量学习的分段线性流形

无监督深度度量学习通过仅使用无标签数据来学习语义表示空间，其中准确估计数据点之间的相似度是一个具有挑战性的问题。为此，我们提出了使用分段线性逼近来建模高维数据流形的方法，其中每个低维线性段近似于点周围小邻域内的数据流形。通过这些邻域来估计数据点之间的相似度。实验证明，与现有最先进技术的相似度估计相比，我们的方法更好地与真实情况相关。我们还证明，在无监督环境中可以使用代理模型分段线性流形，从而提高性能。我们的方法在标准零样本图像检索基准测试上优于现有的无监督度量学习方法。

Mar, 2024

UMAP: 统一流形近似投影降维

UMAP 是一种基于黎曼几何和代数拓扑的流形学习技术，可以作为机器学习中通用的降维算法，具有与 t-SNE 相当的可视化质量和更好的整体结构保留能力，并且没有关于嵌入维度的计算限制。

Feb, 2018

通过流形逼近和投影实现的无监督句子嵌入

该研究提出了一种名为 EMAP 的新技术，通过将句子投射到一个固定维度的流形上，以保留原始空间中的局部邻域来无监督地生成句子嵌入，可以用于文本分类，实验证明该方法性能优于其他最先进方法。

Feb, 2021

利用流形先验在模型训练中融入远程学习

本研究提出了 Distance Learner 方法，利用 “流形假设” 作为先验知识，对于 DNN-based 分类器进行训练，结果表明 Distance Learner 相比标准分类器学习到更有意义的分类边界，并且在对抗鲁棒性任务中表现出色。

Jul, 2022

从热传导角度探究保持测地线的降维

通过热扩散与位形距离之间的具体联系，我们建立了基于黎曼几何的热浸润流形嵌入方法，并展示了我们的方法在保留真实流形距离和保留聚类结构方面的优越表现。

May, 2023