Sep, 2023

通过寻找具有统计显著性的可分离的最佳高斯簇,进行超聚类

TL;DR该论文提出了一种利用 BIC 准则对数据集进行聚类的算法,将高斯聚类的最优数量组合成从统计上可分离的超聚类,该算法包括三个阶段:将数据集表示为高斯分布的混合聚类,使用马氏距离估计聚类间的距离和聚类大小,利用 DBSCAN 方法将聚类组合成超聚类,该算法自动检测最佳数量和形状的超聚类,具有较好的结果和能预测新数据的软聚类能力,但速度较慢,最终聚类结果具有随机性。