Jul, 2018

使用复合分布的K-medoids数据序列聚类

TL;DR本文研究使用k-medoids算法对数据序列进行聚类。提出了基于分布距离度量的k-medoids算法,对已知和未知的分布簇数进行聚类分析。提供了错误概率的上限和大样本情况下的收敛结果。当符合某些条件时,而且使用Kolmogrov-Smirnov距离或最大平均差异作为距离度量时,错误指数具有简单的形式。模拟结果证明了所提出分析的可行性。