本文探讨将三种流行的马氏度量学习算法作为预处理程序,在支持向量机(SVM)- RBF 分类器上的作用。结果表明,这种算法效果并不理想。作者提出一种新的算法 —— 支持向量度量学习(SVML),它无缝地将 Mahalanobis 度量的学习与 RBF-SVM 参数的训练相结合。实验证明,SVML 在精度方面优于所有替代方法,并成为交叉验证选择模型的标准欧几里得度量的严肃替代方案。
Aug, 2012
提出了一种学习跨多个不同领域数据集应用的传输度量的框架,在使用基于嵌入空间的指定聚类的情况下,在少量训练集和浅层网络的情况下,我们在多个变量复杂度的数据集上实现与最新技术水平相当的结果。
Feb, 2023
本文提出了一种将大规模非度量差异矩阵转换为近似正半定核矩阵的有效而准确的技术,该技术结合了 Nystroem 逼近、潜在双中心化和特征值修正,并在几个大规模差异数据集上进行了实验。
Nov, 2014
本文系统地综述了度量学习的前沿研究进展,着重分析了 Mahalanobis 距离度量学习、非线性度量学习、局部度量学习等新近涌现的强大替代方法,讨论了对于结构化数据的度量学习中仍存在的挑战,旨在给出度量学习近年来的发展方向。
Jun, 2013
本文研究了在高维数据情况下的度量学习问题,提出了一种基于 LogDet 距离的学习线性变换的框架,并证明了它可以被有效地核化以学习任意高维空间中的度量,同时还可以将广泛类别的凸损失函数类似地核化,以扩展度量学习的潜在应用。同时,我们证明了这种方法在计算机视觉和文本挖掘等真实世界问题中的有效性。
Oct, 2009
本篇论文提出一种新的核函数以及一种新的编辑相似性模型,可以更好地优化距离和相似度函数,提高 k 近邻算法的性能,并在学习相似性时考虑到泛化能力与算法的稳定性, 解决了当前度量学习方法的局限性,为特征向量和结构化对象(如字符串或树)的度量学习提供了新方法。
Jul, 2013
研究数据驱动的算法选择和度量学习以在聚类问题中同时学习最佳算法和度量。我们的工作考虑从基础度量函数中学习的凸组合的距离函数集合,为此设计了有效的学习算法,并对这些技术进行了全面的实证评估,表明它们可以显著提高聚类性能。
Jul, 2019
本研究主要探讨了在度量空间中的对象,如最近邻搜索和聚类等重要数据挖掘问题,以及在图上聚类和分类等的应用。研究发现,虽然一些流行的大规模图距离量度并非度量空间,但可以定义一类包含多种距离度量且具有可计算性和可扩展性的图距离度量方法。此外,研究人员还探讨了如何将节点的属性信息融入度量中。
Jan, 2018
本文提出了一种新的距离度量方法来解决时间序列数据在分类中被任意数据污染的鲁棒性问题,并在 k 近邻时间序列分类中得到了有竞争力的分类精度。
Aug, 2020
通过综合使用核相关性和差异性,我们提出了一种新的方法来提取非线性信息和实现最优聚类,从而提高聚类的性能。
Mar, 2024