为解决相似性测量困难及非线性相似性未被充分考虑等问题,在核空间中提出一种模型,同时学习聚类指示器矩阵和相似度信息,并通过多核学习能力进一步扩展模型以选择最合适的内核。该模型可自动完成三个子任务以获得最佳聚类解决方案。
May, 2017
本篇论文通过精确定义二重噪声、最小化噪声并设计了一个高效的两步迭代策略,提出了一种新的多核聚类算法,能有效地提高聚类性能。
Jul, 2022
本文提出了一种新的 MKL 框架,通过将每个核定义为一致核的扰动,并为接近一致核的核分配大权重来解决现有算法的各种问题。该框架被集成到用于基于图形的聚类和半监督分类的统一框架中,并在多个基准数据集上得到了实验验证,证实了新框架的优越性。
Jun, 2018
本文提出了一种将大规模非度量差异矩阵转换为近似正半定核矩阵的有效而准确的技术,该技术结合了 Nystroem 逼近、潜在双中心化和特征值修正,并在几个大规模差异数据集上进行了实验。
Nov, 2014
提出了一种通过使用相对距离约束来学习核矩阵的有效算法来解决度量学习问题,并在半监督聚类设置中进行了实验评估以验证其有效性。
Dec, 2016
本文提出了一种基于随机化的近似核 K-means 簇算法,其利用采样点与数据集中所有点之间的核相似性来近似聚类中心,实现了与传统低秩核近似聚类方案相比更好的聚类性能、更短的运行时间和更小的内存需求,最后利用集成聚类技术进一步提高算法性能。
Feb, 2014
本文提出了一种新的本地样本加权多核聚类(LSWMKC)模型,它在核空间中构建一个共识判别力亲和力图,揭示了潜在的本地结构,并输出一个最优的邻域核,具有自然稀疏属性和清晰的块对角结构。此外,LSWMKC 隐式地优化了不同邻居在相应样本上的自适应权重,并表现出比现有的基于核或图形的聚类算法更好的本地流形表示。
本研究提出了一种使用混合内核的度量方法来衡量数据之间的差异,并利用交叉验证确定最佳的内核带宽,针对包含纯连续型、类别型、混合型数据的模拟和真实数据集,利用该方法对现有的基于距离的聚类算法进行聚类,提高了聚类的准确性。
Jun, 2023
多核学习是一种在生物学和生物信息学中用于多组学输入的灵活、有效的方法,并且可以与深度学习架构相竞争,为异构数据集成方法提供了进一步发展和生物数据挖掘研究的方向。
Mar, 2024
本文提出了一种名为 “Collective Kernel Learning” 的方法,利用多个不完整数据集的共享实例来推断潜在的样本相似性,进而解决数据集不完整的问题,通过基于该核矩阵的聚类算法,实验结果表明该方法比其他比较算法在规范化相互信息方面性能提高了两倍。
Oct, 2013