Feb, 2024

基于随机投影的可扩展密度聚类

TL;DR我们提出了一个高效的基于密度的聚类算法 sDBSCAN,利用随机投影的邻域保持特性,能够快速识别核心点及其邻域,理论上,在合理条件下,sDBSCAN 的聚类结构与 DBSCAN 类似,具有较高的概率。sDBSCAN 在真实世界的百万点数据集上比其他聚类算法更快且提供更高的准确性。