基于隐含成对位置相关性的度量学习随机森林
提出了一种新的非线性度量学习方法,其使用基于迭代、分层的半监督最大间隔聚类的树型算法来构建聚类层级森林,并将众多半随机弱度量层级的输出结合起来,以获得强大而稳健的非线性度量模型。与一些最先进的基准测试结果相比,这种方法的结果相当或优于现有最先进算法,并且对噪声更具稳健性。同时,这种方法具有两个主要贡献:第一,它是半监督的,同时融合了约束点和非约束点的信息;第二,它采用了一种松散的约束满足方法,在不同层次的层级中满足不同子集的约束,从而得到更加稳健的学习算法。
Feb, 2014
本文提出了一个新的两阶段度量学习算法,首先通过计算到一组固定锚点的相似度将每个学习实例映射到概率分布,然后在关联的统计流形上定义输入数据空间上的 Fisher 信息距离,这在输入数据空间中引入了一组具有独特特性的距离度量,不像核化度量学习,我们不需要要求相似度度量是半正定的,而且也可以被解释为具有良好定义的距离逼近的局部度量学习算法。我们在多个数据集上评估了其性能,它明显优于其他度量学习方法和支持向量机(SVM)。
May, 2014
本文研究了从一群回答者中同时进行偏好和度量学习的问题,旨在捕捉单个用户的偏好和相似度度量标准,同时享有样本成本分摊。通过研究连续响应设置和噪声二进制测量,证明了该模型足够灵活,能够有效地满足不同需求,并提高了学习的样本复杂度,最终在模拟数据和真实数据中进行了实际效果验证。
Jul, 2022
本论文提出了一个基于三元组比较的新型随机森林算法,用于度量空间中的数据回归和分类,不需要数据点的距离或具体表示方法,并证明其与其他直接访问数据表示的方法相当竞争力强。
Jun, 2018
本篇论文提出一种新的核函数以及一种新的编辑相似性模型,可以更好地优化距离和相似度函数,提高 k 近邻算法的性能,并在学习相似性时考虑到泛化能力与算法的稳定性, 解决了当前度量学习方法的局限性,为特征向量和结构化对象(如字符串或树)的度量学习提供了新方法。
Jul, 2013
本文提出一种快速且可扩展的机器学习算法,用于学习马氏距离指标,并利用凸优化原理和梯度下降方法解决距离度量问题,实现在计算复杂性方面的显著提高,达到与现有方法相当的分类准确度。
Mar, 2010
本文系统地综述了度量学习的前沿研究进展,着重分析了 Mahalanobis 距离度量学习、非线性度量学习、局部度量学习等新近涌现的强大替代方法,讨论了对于结构化数据的度量学习中仍存在的挑战,旨在给出度量学习近年来的发展方向。
Jun, 2013
本文介绍一种新的参数化定向 metric 学习方法,通过学习数据流形上的平滑 metric 矩阵函数,将本地度量作为区域不同点的锚定点上定义的基本度量的线性组合来学习,并应用 manifold 正则化来使学习到的 metric 矩阵函数沿着数据流形的测地线平滑变化,表现出极好的预测能力和可扩展性,并优于多种全局和局部的最先进的度量学习方法以及具有自动内核选择的支持向量机 (SVM)。
Sep, 2012
这项工作提供了基于 PAC 风格的样本复杂度给监督式度量学习,并通过使用数据分布的结构,展示了适用于特定隐含复杂的例子的适当匹配的速率。实验也表明,规范化度量学习优化准则可以帮助适应数据集的固有复杂性,从而提高泛化性能。
May, 2015
该论文提出了一种基于嵌入的新型度量学习方法,通过嵌入树节点向量来学习编辑距离,使欧几里得距离支持类别判别并提高分类准确率,该方法在包括计算机科学、生物医学和自然语言处理数据集的六个基准数据集上优于目前树形度量学习技术的最新技术。
May, 2018