凸双聚类
研究了约束条件下的聚类算法,并提出了一种名为 COBRA 的主动方法,该方法应用最适用的约束来尽可能少地产生好的聚类结果,以提高聚类质量和运行时间。
Jan, 2018
使用玻色子抽样方法实现基于矩阵永久性的双聚类识别,并提出一种使用高斯玻色子抽样方法在数据集中找到最密集子图的启发式方法,通过将数据集转换为二部图并运行高斯玻色子抽样来实现。
May, 2024
本文提出了一种双聚类算法框架用于解决聚类、社区检测和多参数模型估计等问题,首次将多参数模型的任务形式化为共识问题,并且证明了这些任务的等效性,并与计算 Gestalt 程序建立了联系。在图像处理应用中,通过广泛的实验结果展示了该算法的有效性。
Apr, 2014
本文介绍了一种新的聚类方法 ——Sparse Convex Clustering,该方法采用一种正则化形式的凸聚类方法来进行特征选择,并使用基于聚类稳定性的调整标准来优化聚类效果。作者通过多种数值实验和真实数据应用验证了该聚类方法的有效性。
Jan, 2016
我们提出了一种定制的分支限界算法来解决 $k$-densest-disjoint biclique 问题,通过同时聚类数据矩阵的行和列,找到给定加权完全二分图的 $k$ 个不相交的完全二分子图(称为 bicliques),使它们的密度之和最大化。
Mar, 2024
提出一种贝叶斯方法,用于联合双聚类多个数据来源,使得数据驱动检测出数据来源中存在的线性结构,仿真研究表明该方法可在异质数据来源中可靠地推断出双聚类,并在 NCI-DREAM 药物敏感性预测挑战赛中取得了良好的预测准确性。
Dec, 2015
我们提出了一种贝叶斯模型,用于时间双聚类问题的分析,其中包含嵌套分区,通过这种方法可以发现多个主体之间在时间上记录的测量数据存在相似趋势以及相关测量数据的时间变化群组,并可根据数据来确定主体和测量群组的数量以及测量分区中变化点的数量和位置。
Jun, 2024
本文介绍了一种名称为 LAS 的统计学动机的双聚类方法,它能够在给定的实值数据矩阵中找到大的平均子矩阵,通过验证研究得出,该方法是探索高维数据中发现生物学相关结构的有效工具。
May, 2009
聚类是数据科学和机器学习中最基本的工具之一,k-means 聚类是最常见的方法之一。本文研究了低维数据实例的 k-means 问题,并将其表示为结构化的凸分配问题,利用低维结构解决大数据集的问题。该方法结合了全局优化理论的方法来加速处理程序,并提供了性能的数值结果。
Feb, 2024
本文研究如何针对重叠聚类进行双分图可视化问题,并提出能够满足近距离聚类元素、连续区域聚类元素和大范围不间断设计限制的目标函数和算法,并在实际数据集上进行实验,发现最佳结果采用局部放置相似聚类成员行列的新型启发式算法。
Jul, 2023