图嵌入的自适应模糊C均值
本文从贝叶斯非参数的角度出发,重新审视了k-means聚类算法。通过分析Dirichlet过程混合物的Gibbs抽样算法,我们发现这个算法在极限下接近于硬聚类算法,可以优雅且单调地最小化一个类似k-means的聚类目标,包括对聚类数的惩罚。我们将这个方法推广到了多个数据集的聚类情况,并讨论了进一步的扩展,包括门槛特征向量的光谱松弛和在图中不需要固定聚类数的归一化割图聚类算法。
Nov, 2011
本文提出了一种相似性驱动的聚类合并算法,用于解决聚类验证问题,算法采用聚类相似度矩阵计算相似性,自适应阈值进行合并,同时使用具有p-范数距离和聚类主成分的修改广义目标函数来进行非监督聚类。
Jul, 2012
本文综述了共识聚类的现有文献,探索不同类别之间的关系,并提供了转换基本分区到其他表示形式的共识机制,以及在不同设置和问题上的几种扩展方法和应用,包括约束聚类、域自适应、特征选择和异常检测等。
May, 2019
本文关注于联邦聚类问题,提出了一种用于联邦学习的延伸模糊C均值算法,并通过数值实验评估了其行为,其中一种方法即使在复杂情况下也能够确定良好的全局聚类中心,但也认识到许多挑战的问题仍然存在。
Jan, 2022
本文提出了一种新型模糊系统 Graph Fuzzy System (GFS), 用于图数据建模,其中定义了与 GFS 相关概念,构建了 GFS 建模框架,并提出了学习 GFS 的算法,其中包括图神经网络和 K-原型图聚类。实验结果表明,该方法继承了现有主流图神经网络方法和传统模糊系统方法的优点并取得了更好的性能。
Oct, 2022
《Mixture-Models》是一个开源的Python库,用于拟合高斯混合模型及其变种,如Sparimonious GMM、因子分析混合模型、MClust模型、学生t分布混合模型等。它使用各种一阶/二阶优化算法,如梯度下降和牛顿法,通过自动微分工具简化了这些模型的实现和分析,从而帮助扩展这些模型到高维数据。该库提供了用户友好的模型评估工具,如BIC、AIC和对数似然估计。该软件包具有很高的可扩展性,允许用户轻松地添加新的分布和优化技术。我们进行了大规模模拟实验,比较了各种基于梯度的方法与期望最大化算法在各种设置下的性能,并确定相应最适合的方法。
Feb, 2024
平衡K-means(EKM)是一种新颖且简单的K-means类型算法,通过减少大簇中心聚集的趋势,在不平衡数据上显著改善聚类结果。该论文还介绍了HKM、FKM和EKM的统一视角,展示它们本质上是梯度下降算法,并与牛顿法有明确的关系。通过将高维数据映射到低维、适合EKM的空间,使用EKM进行深度聚类可在不平衡数据上将聚类准确性提高35%。
Feb, 2024
本文提出了一种新颖的模糊K-Means聚类算法,通过距离矩阵计算获得成员矩阵,从而完全消除了对聚类中心的依赖,增强了距离测量和算法的性能与鲁棒性。实验证明了该算法的有效性。
Apr, 2024
提出了一种用于模糊C均值算法得到的模糊聚类的新聚类有效性指标。该提出的有效性指标利用了模糊聚类之间的簇间接近度。簇间接近度用于衡量簇之间的重叠程度。低接近度值指的是良好分区的簇。通过将簇间接近度相对于c最小化,得到最佳的模糊C-分区。使用知名数据集进行测试以展示所提指标的有效性和可靠性。
Jul, 2024
本研究解决了现代通信技术中语音信号处理的关键挑战,即在嘈杂环境中清晰地分离和识别语音。通过对核模糊C均值方法(KFCM)的深入探讨,研究发现KFCM在处理非线性和非平稳噪声方面优于传统的K均值和模糊C均值方法,表明其在语音增强应用中的广泛适应性和潜在影响。此外,论文还指出当前方法中的不足,提倡发展动态聚类算法以改善语音识别质量。
Sep, 2024