本文提出了一种基于分割二分图的新型数据聚类方法,旨在最小化未匹配的顶点之间的边权重总和,通过边权重矩阵的奇异值分解来近似解决这个最小化问题并且在文档聚类问题上取得了显著的效果。
Aug, 2001
本文提出一种基于谱初始化和伪似然分类器的两阶段快速过程,用于网络双分区检测或更一般地解决网络双聚类问题。该程序是弱一致的,同时在双分块随机模型下建立。通过数值模拟,证明了这种程序的有效性。
Mar, 2018
基于非负矩阵分解的概率模型统一了节点聚类和图简化,提供了建模任意图结构的框架。通过将硬聚类放松为软聚类,我们的算法将潜在的困难聚类问题转化为易处理的问题。
Aug, 2023
本文提出了一种新算法 —— 最大似然凸化版本,用于解决在随机块模型环境下的社交网络图聚类问题,相较于目前已有算法,本文算法在允许普遍规模的簇大小时的表现高出多项式因子。
Oct, 2012
使用玻色子抽样方法实现基于矩阵永久性的双聚类识别,并提出一种使用高斯玻色子抽样方法在数据集中找到最密集子图的启发式方法,通过将数据集转换为二部图并运行高斯玻色子抽样来实现。
May, 2024
在半随机图模型中,我们研究了平衡切割问题的精确性和时间复杂度,并且提出了第一个近似线性时间算法,以及与相关问题的拓展应用和对半随机分层随机块模型的聚类目标函数进行近似线性时间 O (1) 近似的方法。
Jun, 2024
本文在数据流中对二分图聚类和布尔矩阵分解问题进行了研究,提出一种使用亚线性空间复杂度,在数据流遍历一遍后能够恢复右部聚类的算法,并且在第二次遍历中能够恢复左部聚类,同时还能够扩展该算法来解决布尔矩阵分解问题。
Dec, 2020
本文提出了一种新的一步二分图切割(OBCut)标准,可以在线性时间内强制执行归一化条件,并将其扩展到可扩展的子空间聚类方法中。实验表明,该方法在各种普通和大规模数据集上具有有效性和可扩展性。
May, 2023
本文提出一种新的数据驱动正则化方法来解决稀疏网络中恢复邻接矩阵集中性的问题,进而探讨了一种新的谱截断方法对一般 SBM 中的分类错误率的影响,并在模型的一些扩展,包括不均匀随机图模型和二元聚类问题中得到更优性能的证明。
本文研究如何针对重叠聚类进行双分图可视化问题,并提出能够满足近距离聚类元素、连续区域聚类元素和大范围不间断设计限制的目标函数和算法,并在实际数据集上进行实验,发现最佳结果采用局部放置相似聚类成员行列的新型启发式算法。
Jul, 2023