Sep, 2024
适用于大规模聚类的高性能外部有效性指标
A High-Performance External Validity Index for Clustering with a Large
Number of Clusters
TL;DR本文解决了大规模数据集下多个聚类方法的聚类评价问题,提出了一种基于稳定匹配的配对(SMBP)算法,通过稳定匹配框架实现不同聚类方法间的聚类配对,计算复杂度降低至O(N²)。SMBP在真实和合成数据集上的评估显示其与传统最大加权匹配(MWM)在准确度上可比,但在计算效率上更具优势,特别适用于大规模、平衡及不平衡的数据集。