Apr, 2023

Mini-batch k-means在O(d/ε)次迭代内终止

TL;DR本文考虑小批量$k$-means聚类算法的可行性及效果,证明了在合适的批量大小情况下,算法会在有限的时间内收敛,而且$k$-means++算法能够取得和全量数据一样的近似比例。此外,还将结果应用到了Python的Scikit-learn(sklearn)库中。