Sep, 2024

适用于大规模聚类的高性能外部有效性指标

TL;DR本文解决了大规模数据集下多个聚类方法的聚类评价问题,提出了一种基于稳定匹配的配对(SMBP)算法,通过稳定匹配框架实现不同聚类方法间的聚类配对,计算复杂度降低至O(N²)。SMBP在真实和合成数据集上的评估显示其与传统最大加权匹配(MWM)在准确度上可比,但在计算效率上更具优势,特别适用于大规模、平衡及不平衡的数据集。