Mar, 2023

分布式 Silhouette 算法:对大数据进行聚类评估

TL;DR本文提出了一种可在分布式环境中高效并行运行的线性复杂度算法来计算聚类的 Silhouette 指数。该算法可以在 Apache Spark ML 库中免费使用。