BriefGPT.xyz
Nov, 2016
随机k-means的收敛速率
Convergence rate of stochastic k-means
HTML
PDF
Cheng Tang, Claire Monteleoni
TL;DR
该论文研究了在线学习和小批量k均值变体算法在大规模聚类和无监督特征学习中的应用,通过对算法的解空间轨迹的描述和对几何洞察的利用,克服了$k$-均值目标函数的非凸和不可微问题,并证明了在一般条件下,它们能以速率$O(rac{1}{t})$收敛到一个局部最优解,并且在可聚类数据集上,小批量$k$-means算法还可以在高概率下收敛到最优$k$-means解。
Abstract
We analyze online \cite{BottouBengio} and mini-batch \cite{Sculley} $k$-means variants. Both scale up the widely used $k$-means algorithm via
stochastic approximation
, and have become popular for large-scale
clustering<
→