基于随机投影的可扩展密度聚类
提出了 DBSCAN ++ 密度聚类的简单改进方法,其只需要计算所选点的密度,可在大型数据集上提供与传统 DBSCAN 相媲美的性能和稳健性,同时运行时间很短。还证明了其在估计速率方面达到了最佳的极小极大值,这一质量可能是独立利益的。
Oct, 2018
LINSCAN 是一种新的算法,通过利用 DBSCAN 和 OPTICS 的优势,将点嵌入成近似其局部邻域的正态分布,并利用从 Kullback Leibler 散度派生的距离函数,以检测和区分在空间上密集但具有正交协方差的线性聚类,我们演示了如何将 LINSCAN 应用于地震数据,识别出活动断层,包括交叉断层,并确定它们的方向。最后,我们讨论了 DBSCAN 和 OPTICS 的扩展算法必须具备的性质,以保持这些算法的稳定性优势。
Jun, 2024
非监督学习中的聚类是一个基础问题,本研究介绍了一种简单的随机聚类算法,它在任意 k 下的期望运行时间为 O (nnz (X) + nlogn),并在 K-means 目标函数上实现了近似比例约为 O (k^4) 的算法,通过实验证明与现有方法相比,我们的聚类算法在运行时间和聚类质量之间有一个新的权衡。
Oct, 2023
本文研究了密度聚类方法以及其特点、优缺点,重点探究了其在不同类型数据集中挖掘有用和适当模式的适用性,具体讨论了 DBSCAN、OPTICS、DENCLUE 和 VDBSCAN 等方法。
Jun, 2023
该论文提出了一种利用 BIC 准则对数据集进行聚类的算法,将高斯聚类的最优数量组合成从统计上可分离的超聚类,该算法包括三个阶段:将数据集表示为高斯分布的混合聚类,使用马氏距离估计聚类间的距离和聚类大小,利用 DBSCAN 方法将聚类组合成超聚类,该算法自动检测最佳数量和形状的超聚类,具有较好的结果和能预测新数据的软聚类能力,但速度较慢,最终聚类结果具有随机性。
Sep, 2023
介绍了一个改进版本的 DBSCAN 算法,利用相似性图的块对角特性来引导聚类过程,通过未知排列构建图,并通过梯度下降求解,最终生成块对角图结构,以提供自动和交互式聚类分析的基础。
Mar, 2024
该研究提出了一种名为 SpectACl 的新聚类方法,旨在结合最小割和最大密度的优点,同时解决噪音和密度不同问题。实验表明该方法具有良好的效果。
Jul, 2019