几何平均度量学习
用低秩方法从数据中学习马氏度量,该方法受到几何平均度量学习算法的启发,可以联合学习低维子空间和适合数据的马氏度量,结果显示在更低的秩下可以有效地与几何平均度量学习算法竞争。
Jun, 2018
本文提出了一种基于连续凸损失优化的简单优雅方法,用于线性距离度量学习,并针对不同的噪声模型推导了相应的损失函数。研究结果表明,即使数据存在噪声,只要样本充足就可以学习到地面事实线性度量,并提供相应的样本复杂度限制。此外,我们还提出了一种有效地将学习模型截断为低秩模型的方法,该方法可证明在损失函数和参数方面都能保持准确性,这是该领域首次出现这种结果。实验结果表明了理论结果的正确性。
Jun, 2023
本文介绍了一个派生于黎曼商几何的指标和均值,用于一组固定秩的半正定矩阵。从积极锥的缩紧几何和相关流畅自然度量,提出了所提出的指标。所得到的黎曼空间具有强的几何特性:它是测地线完成的,并且度量在保持角度的所有变换(正交变换、比例变换和伪逆变换)下是不变的。提出了与所关联的黎曼距离的有意义的近似,可以通过基于 SVD 的简单算法有效地数值计算。其中的几何平均保留着秩,具有最理想的几何平均特性并易于计算。
Jul, 2008
本文提出了一个解决给定可微流形相关的黎曼度量的问题的解决方案。度量学习问题基于最小化给定点集的相对体积。我们推导了多项式单纯形上一个度量族的细节。该度量在文本分类中具有应用,并且与文本文档的 TFIDF 表示有些相似。
Oct, 2012
本文介绍一种新的参数化定向 metric 学习方法,通过学习数据流形上的平滑 metric 矩阵函数,将本地度量作为区域不同点的锚定点上定义的基本度量的线性组合来学习,并应用 manifold 正则化来使学习到的 metric 矩阵函数沿着数据流形的测地线平滑变化,表现出极好的预测能力和可扩展性,并优于多种全局和局部的最先进的度量学习方法以及具有自动内核选择的支持向量机 (SVM)。
Sep, 2012
本文系统地综述了度量学习的前沿研究进展,着重分析了 Mahalanobis 距离度量学习、非线性度量学习、局部度量学习等新近涌现的强大替代方法,讨论了对于结构化数据的度量学习中仍存在的挑战,旨在给出度量学习近年来的发展方向。
Jun, 2013
本篇论文提出一种新的核函数以及一种新的编辑相似性模型,可以更好地优化距离和相似度函数,提高 k 近邻算法的性能,并在学习相似性时考虑到泛化能力与算法的稳定性, 解决了当前度量学习方法的局限性,为特征向量和结构化对象(如字符串或树)的度量学习提供了新方法。
Jul, 2013
本文提出一种快速且可扩展的机器学习算法,用于学习马氏距离指标,并利用凸优化原理和梯度下降方法解决距离度量问题,实现在计算复杂性方面的显著提高,达到与现有方法相当的分类准确度。
Mar, 2010
本文提出了一个新的两阶段度量学习算法,首先通过计算到一组固定锚点的相似度将每个学习实例映射到概率分布,然后在关联的统计流形上定义输入数据空间上的 Fisher 信息距离,这在输入数据空间中引入了一组具有独特特性的距离度量,不像核化度量学习,我们不需要要求相似度度量是半正定的,而且也可以被解释为具有良好定义的距离逼近的局部度量学习算法。我们在多个数据集上评估了其性能,它明显优于其他度量学习方法和支持向量机(SVM)。
May, 2014
本教程提供了关于距离度量学习的理论基础和基础知识,以及最常见算法的全面实验分析,重点考虑降维和核化,在标准分类问题中评估所有算法的能力,并讨论了这个领域的未来前景和挑战。
Dec, 2018