内核距离简介
针对结构化输入的机器学习问题,提出了一种只基于输入之间的距离度量而不是特征表示估算函数 f (x),应用正定核泛函和重现核希尔伯特空间来构建算法,并将其与现有的基于距离学习的方法进行比较,结果表明该方法在分类实验中具有更好的推广性能。
Feb, 2018
文章采用持久同调方法总结距离函数下水平集的拓扑特征,提出了抗噪声和异常值的距离测度方法 DTM 和核函数距离,并对 DTM 进行了浓度界定和参数选择。
Dec, 2014
本文提出了一个统一的框架,将统计领域中的能量距离和距离协方差与机器学习中的分布嵌入到重现核 Hilbert 空间之间的距离联系起来,并研究了半度量与其诱导的核函数的性质。最后,我们研究了这类核函数在两样本和独立性检验中的性能。
May, 2012
研究核均值嵌入的三个问题:(I)对于给定的内核,可以嵌入哪些集?(II)嵌入何时在 M 上是单射的(在这种情况下,dk 是度量的)?(III)dk 诱导的拓扑与 M 上的其他拓扑如何比较?
Apr, 2016
该文介绍了一种基于希尔伯特空间嵌入的分布表征方法,该方法利用再生核希尔伯特空间将分布映射到一个空间中,并扩展了一般支持向量机和其他核方法的整个内核方法库,为概率测量、统计推断、因果发现和深度学习等领域提供了广泛应用,并讨论了该方法的理论保证,应用和未来的研究方向。
May, 2016
本文提出了一种新的双射变换方法,将 Distance-based tests 和 Kernel-based tests 两者结合起来,并简化了固定点变换方法,提高了数据结构保留能力。该方法有望促进 Distance-based and Kernel-based 方法学术界之间的相互了解和直接交流。
Jun, 2018
该论文介绍了模糊集上的核的概念和其在相似度度量中的应用,提出了交叉积、交集、非单例和基于距离的模糊核等不同类型的核,并探讨了在包含本体和认知解释的不确定数据上应用这些核的机器学习和数据科学任务。
Jul, 2019
该文章提出了一个概率测度传输的一般框架,利用常微分方程和再生核希尔伯特空间进行最小差异生成建模和采样,受到微分同胚匹配和图像注册的思想的启发。通过理论分析,给出了该方法的先验误差界限,包括模型复杂度、训练集中的样本数量和模型规范错误等因素。大量的数值实验进一步展示了该方法的特性、优势和弱点,并扩展了其在条件模拟和推理等其他任务中的适用性。
Feb, 2024
本教程提供了关于距离度量学习的理论基础和基础知识,以及最常见算法的全面实验分析,重点考虑降维和核化,在标准分类问题中评估所有算法的能力,并讨论了这个领域的未来前景和挑战。
Dec, 2018