Feb, 2024

基于平衡 k 均值的不均衡数据聚类

TL;DR平衡 K-means(EKM)是一种新颖且简单的 K-means 类型算法,通过减少大簇中心聚集的趋势,在不平衡数据上显著改善聚类结果。该论文还介绍了 HKM、FKM 和 EKM 的统一视角,展示它们本质上是梯度下降算法,并与牛顿法有明确的关系。通过将高维数据映射到低维、适合 EKM 的空间,使用 EKM 进行深度聚类可在不平衡数据上将聚类准确性提高 35%。