Oct, 2017

通过探索密度山的演变对数据流进行聚类

TL;DR本文提出了一种基于密度山演化的流式聚类算法 EDMStream,该算法通过跟踪密度山的变化来更新聚类结果和捕捉聚类演化活动,同时提供了高效的数据结构和过滤方案,确保了实时更新,实现了在线聚类。实验结果表明,相比于现有的流式聚类算法,如 D-stream,DenStream,DBSTREAM 和 MR-stream,我们的算法对于群集更新的响应速度快得多(比竞争对手的最佳表现快 7-15 倍),同时达到了相当的群集质量,成功捕捉了群集演化活动。