基于隐含成对位置相关性的度量学习随机森林

Jan, 2012

基于隐含成对位置相关性的度量学习随机森林

Random Forests for Metric Learning with Implicit Pairwise Position Dependence

Caiming Xiong, David Johnson, Ran Xu, Jason J. Corso

TL;DR使用基于随机森林的分类器来学习单个度量标准，实现在特征空间内自适应地调整距离函数，该方法在多个数据集上表现出色，并且在准确性和速度方面均优于现有的全局和多度量方法。

Abstract

metric learning makes it plausible to learn distances for complex distributions of data from labeled data. However, to date, most metric learning methods are based on a single →

metric learning mahalanobis metric heterogeneous data single metric random forest-based classifier

发现论文，激发创造

通过最大间隔集群层级树实现半监督非线性距离度量学习

提出了一种新的非线性度量学习方法，其使用基于迭代、分层的半监督最大间隔聚类的树型算法来构建聚类层级森林，并将众多半随机弱度量层级的输出结合起来，以获得强大而稳健的非线性度量模型。与一些最先进的基准测试结果相比，这种方法的结果相当或优于现有最先进算法，并且对噪声更具稳健性。同时，这种方法具有两个主要贡献：第一，它是半监督的，同时融合了约束点和非约束点的信息；第二，它采用了一种松散的约束满足方法，在不同层次的层级中满足不同子集的约束，从而得到更加稳健的学习算法。

Feb, 2014

两阶段度量学习

本文提出了一个新的两阶段度量学习算法，首先通过计算到一组固定锚点的相似度将每个学习实例映射到概率分布，然后在关联的统计流形上定义输入数据空间上的 Fisher 信息距离，这在输入数据空间中引入了一组具有独特特性的距离度量，不像核化度量学习，我们不需要要求相似度度量是半正定的，而且也可以被解释为具有良好定义的距离逼近的局部度量学习算法。我们在多个数据集上评估了其性能，它明显优于其他度量学习方法和支持向量机（SVM）。

May, 2014

一对多：多用户同时度量和偏好学习

本文研究了从一群回答者中同时进行偏好和度量学习的问题，旨在捕捉单个用户的偏好和相似度度量标准，同时享有样本成本分摊。通过研究连续响应设置和噪声二进制测量，证明了该模型足够灵活，能够有效地满足不同需求，并提高了学习的样本复杂度，最终在模拟数据和真实数据中进行了实际效果验证。

Jul, 2022

基于比较的随机森林

本论文提出了一个基于三元组比较的新型随机森林算法，用于度量空间中的数据回归和分类，不需要数据点的距离或具体表示方法，并证明其与其他直接访问数据表示的方法相当竞争力强。

Jun, 2018

具有泛化保证的监督度量学习

本篇论文提出一种新的核函数以及一种新的编辑相似性模型，可以更好地优化距离和相似度函数，提高 k 近邻算法的性能，并在学习相似性时考虑到泛化能力与算法的稳定性，解决了当前度量学习方法的局限性，为特征向量和结构化对象（如字符串或树）的度量学习提供了新方法。

Jul, 2013

可扩展的大边界马氏距离度量学习

本文提出一种快速且可扩展的机器学习算法，用于学习马氏距离指标，并利用凸优化原理和梯度下降方法解决距离度量问题，实现在计算复杂性方面的显著提高，达到与现有方法相当的分类准确度。

Mar, 2010

特征向量和结构化数据的度量学习综述

本文系统地综述了度量学习的前沿研究进展，着重分析了 Mahalanobis 距离度量学习、非线性度量学习、局部度量学习等新近涌现的强大替代方法，讨论了对于结构化数据的度量学习中仍存在的挑战，旨在给出度量学习近年来的发展方向。

Jun, 2013

最近邻分类的参数局部度量学习

本文介绍一种新的参数化定向 metric 学习方法，通过学习数据流形上的平滑 metric 矩阵函数，将本地度量作为区域不同点的锚定点上定义的基本度量的线性组合来学习，并应用 manifold 正则化来使学习到的 metric 矩阵函数沿着数据流形的测地线平滑变化，表现出极好的预测能力和可扩展性，并优于多种全局和局部的最先进的度量学习方法以及具有自动内核选择的支持向量机 (SVM)。

Sep, 2012

学习 Mahalanobis 距离度量的样本复杂度

这项工作提供了基于 PAC 风格的样本复杂度给监督式度量学习，并通过使用数据分布的结构，展示了适用于特定隐含复杂的例子的适当匹配的速率。实验也表明，规范化度量学习优化准则可以帮助适应数据集的固有复杂性，从而提高泛化性能。

May, 2015

自适应符号嵌入的树编辑距离学习：补充材料和结果

该论文提出了一种基于嵌入的新型度量学习方法，通过嵌入树节点向量来学习编辑距离，使欧几里得距离支持类别判别并提高分类准确率，该方法在包括计算机科学、生物医学和自然语言处理数据集的六个基准数据集上优于目前树形度量学习技术的最新技术。

May, 2018