基于随机森林保几何性质的监督流形学习
GLoMAP 及其归纳版本 iGLoMAP 是一种新颖的流形学习方法,用于非线性降维和高维数据可视化,能有效地保留局部和全局的距离估计,并通过优化过程逐步展示从全局到局部形成的进展。iGLoMAP 通过深度神经网络使得在未见过的数据点上能够提供低维嵌入而无需重新训练算法,并适用于小批量学习,以加快梯度计算速度。经过与当前最先进的方法进行竞争性实验,在模拟数据和真实数据环境下成功应用了 GLoMAP 和 iGLoMAP。
Jun, 2024
该论文提出了一种基于标签传播模型改进流形正则化的方法,通过增强扩散图算法的概率转移矩阵来描述流形上的标签传播过程,并证明了扩展的标签传播函数在足够长时间后收敛到稳定分布,成为一个可用的分类器,实验证明了该方法的优越性。
Mar, 2024
通过结合随机森林模型和自编码器的功能学习能力,我们为基于随机森林的监督降维方法 RF-PHATE 提供了一种新的样本外扩展方法,并通过定量评估不同自编码器结构,发现了用于嵌入扩展问题的网络结构,进一步地,通过利用基于邻近性的原型,我们在不降低扩展质量的情况下实现了 40% 的训练时间的减少。我们的方法不需要样本外样本的标签信息,因此作为半监督方法,并且仅使用 10% 的训练数据也可以获得一致的质量。
Jun, 2024
本文提出了一种基于自动编码器与流形学习结合的数据探索方法,利用几何正则化项鼓励学习得到的潜在表示沿着数据的内在几何结构发展,并与常规方法相比较,证明该方法在保留内在结构、扩展能力和数据重构方面具有优势
Jul, 2020
本文提出了一种基于局部保持投影(LPP)准则的 Grassmann 流形领域内的无监督降维算法,通过将高维 Grassmann 流形映射到具有更具有判别能力的相对低维流形的方式,可以显著减小计算成本并提高分类和聚类任务的性能。
Apr, 2017
无监督深度度量学习通过仅使用无标签数据来学习语义表示空间,其中准确估计数据点之间的相似度是一个具有挑战性的问题。为此,我们提出了使用分段线性逼近来建模高维数据流形的方法,其中每个低维线性段近似于点周围小邻域内的数据流形。通过这些邻域来估计数据点之间的相似度。实验证明,与现有最先进技术的相似度估计相比,我们的方法更好地与真实情况相关。我们还证明,在无监督环境中可以使用代理模型分段线性流形,从而提高性能。我们的方法在标准零样本图像检索基准测试上优于现有的无监督度量学习方法。
Mar, 2024
UMAP 是一种基于黎曼几何和代数拓扑的流形学习技术,可以作为机器学习中通用的降维算法,具有与 t-SNE 相当的可视化质量和更好的整体结构保留能力,并且没有关于嵌入维度的计算限制。
Feb, 2018
该研究提出了一种名为 EMAP 的新技术,通过将句子投射到一个固定维度的流形上,以保留原始空间中的局部邻域来无监督地生成句子嵌入,可以用于文本分类,实验证明该方法性能优于其他最先进方法。
Feb, 2021
本研究提出了 Distance Learner 方法,利用 “流形假设” 作为先验知识,对于 DNN-based 分类器进行训练,结果表明 Distance Learner 相比标准分类器学习到更有意义的分类边界,并且在对抗鲁棒性任务中表现出色。
Jul, 2022