Oct, 2016

压缩 K 均值

TL;DR本文提出了一种压缩版本的 K-means 聚类方法 CKM,并通过实验证明,当采用与聚类中心数量和维度成比例的草图大小时,CKM 的聚类效果与 Lloyd-Max 相当,但计算复杂度与数据集大小无关,并且不需要多次重复运行,同时可以实现更好的手写数字分类效果。