具有泛化保证的监督度量学习

Jul, 2013

Supervised Metric Learning with Generalization Guarantees

Aurélien Bellet

TL;DR本篇论文提出一种新的核函数以及一种新的编辑相似性模型，可以更好地优化距离和相似度函数，提高 k 近邻算法的性能，并在学习相似性时考虑到泛化能力与算法的稳定性，解决了当前度量学习方法的局限性，为特征向量和结构化对象（如字符串或树）的度量学习提供了新方法。

Abstract

The crucial importance of metrics in machine learning algorithms has led to an increasing interest in optimizing distance and similarity functions, an area of research known as metric learning. When data consist of feature vectors, a large body of work has focused on learning a Mahalan

metric learning edit distance linear classifiers similarity learning generalization

发现论文，激发创造

特征向量和结构化数据的度量学习综述

本文系统地综述了度量学习的前沿研究进展，着重分析了 Mahalanobis 距离度量学习、非线性度量学习、局部度量学习等新近涌现的强大替代方法，讨论了对于结构化数据的度量学习中仍存在的挑战，旨在给出度量学习近年来的发展方向。

Jun, 2013

度量学习的鲁棒性和泛化性

本文介绍了一种算法鲁棒性的概念来推导度量学习的泛化界限，并且证明了弱稳健性是度量学习算法泛化的必要且充分条件，从而扩展了现有度量学习算法的泛化结果。

Sep, 2012

稀疏线性分类的可证明准确性相似度学习

本文介绍一种基于非半正定线性相似性的学习算法，用于分类，该算法能够通过最优化距离和相似度函数来在非线性特征空间中学习，该方法得到应用后，在各种数据集上比起现有方法具有更好的效果，而且速度快、防止过拟合和产生非常稀疏的分类器。

Jun, 2012

利用线性变换进行度量和核学习

本文研究了在高维数据情况下的度量学习问题，提出了一种基于 LogDet 距离的学习线性变换的框架，并证明了它可以被有效地核化以学习任意高维空间中的度量，同时还可以将广泛类别的凸损失函数类似地核化，以扩展度量学习的潜在应用。同时，我们证明了这种方法在计算机视觉和文本挖掘等真实世界问题中的有效性。

Oct, 2009

通过 $(ε, γ, τ)$- 优良相似函数的算法鲁棒性学习

本文介绍了一种新的算法鲁棒性框架，在此基础上为相似函数的分类器提供了新的泛化界。

Dec, 2014

线性距离度量学习

本文提出了一种基于连续凸损失优化的简单优雅方法，用于线性距离度量学习，并针对不同的噪声模型推导了相应的损失函数。研究结果表明，即使数据存在噪声，只要样本充足就可以学习到地面事实线性度量，并提供相应的样本复杂度限制。此外，我们还提出了一种有效地将学习模型截断为低秩模型的方法，该方法可证明在损失函数和参数方面都能保持准确性，这是该领域首次出现这种结果。实验结果表明了理论结果的正确性。

Jun, 2023

自适应符号嵌入的树编辑距离学习：补充材料和结果

该论文提出了一种基于嵌入的新型度量学习方法，通过嵌入树节点向量来学习编辑距离，使欧几里得距离支持类别判别并提高分类准确率，该方法在包括计算机科学、生物医学和自然语言处理数据集的六个基准数据集上优于目前树形度量学习技术的最新技术。

May, 2018

最近邻分类的参数局部度量学习

本文介绍一种新的参数化定向 metric 学习方法，通过学习数据流形上的平滑 metric 矩阵函数，将本地度量作为区域不同点的锚定点上定义的基本度量的线性组合来学习，并应用 manifold 正则化来使学习到的 metric 矩阵函数沿着数据流形的测地线平滑变化，表现出极好的预测能力和可扩展性，并优于多种全局和局部的最先进的度量学习方法以及具有自动内核选择的支持向量机 (SVM)。

Sep, 2012

距离度量学习教程：数学基础、算法、实验分析、前景与挑战（包括数学背景和详细算法解释的附录）

本教程提供了关于距离度量学习的理论基础和基础知识，以及最常见算法的全面实验分析，重点考虑降维和核化，在标准分类问题中评估所有算法的能力，并讨论了这个领域的未来前景和挑战。

Dec, 2018

度量学习和相似度学习的泛化误差界

本文利用 U 统计和 Rademacher 复杂性分析方法，针对度量学习和相似度学习，推导出了一种新的泛化边界方法，证明了 L1 范数正则化的稀疏度量学习和相似度学习可能比 Frobenius 范数正则化的模型具有更好的边界效果。

Jul, 2012