ICMLJan, 2016

带有迭代运行时间边界的双树 $k$ 均值

TL;DR本文提出了一种双树算法,用于加速 k-means 聚类算法在大规模 K 簇和数据集下进行迭代,在使用了覆盖树后,该算法的单次迭代运行时间为 O (N + k log k),并且在实践中表现得很好。