块对角引导 DBSCAN 聚类
该论文提出了一种基于自回归、块对角表示和 Nyström 逼近的重新启动谱聚类框架,可以应用于大规模问题中,其理论结果证明了不精确计算在谱聚类中是合理的。
Jun, 2023
基于图的聚类分析中,我们提出了一种快速而稳健的稀疏感知块对角表示方法 (FRS-BDR),该方法能够共同估计聚类成员资格和块数,并在各种真实应用中展现出了聚类准确性、对破损特征的稳健性、计算时间和聚类枚举性能的有效性。
Dec, 2023
提出了 DBSCAN ++ 密度聚类的简单改进方法,其只需要计算所选点的密度,可在大型数据集上提供与传统 DBSCAN 相媲美的性能和稳健性,同时运行时间很短。还证明了其在估计速率方面达到了最佳的极小极大值,这一质量可能是独立利益的。
Oct, 2018
提出了一种结合普适引力算法的数据驱动巴格曼散度参数优化聚类算法(DBGSA),通过构建具有特殊属性的引力系数方程,逐渐减少迭代过程中的影响因子,并引入巴格曼散度广义幂均值信息损失最小化来识别聚类中心和构建超参数识别优化模型,有效解决了改进数据集中手动调整和不确定性的问题。对四个模拟数据集和六个真实数据集进行了广泛实验,结果表明 DBGSA 相对于其他类似方法如改进聚类算法和改进数据集,平均提高了 63.8%的各种聚类算法的准确性。此外,建立了一个三维网格搜索来比较阈值条件下不同参数值的效果,并发现我们模型提供的参数集是最优的,这一发现为算法的高准确性和强韧性提供了有力的证据。
Jul, 2023
通过统计学的角度研究了有向图聚类问题,将聚类问题建模为有向随机块模型(DSBM)中估计底层社区的过程,并通过最大似然估计(MLE)推断出给定观察到的图结构的最可能的社区分配。此外,还建立了该 MLE 公式与新型流优化启发式算法之间的等价关系,该算法同时考虑了两个重要的有向图统计量:边密度和边方向。在此基础上,提出了两种高效且可解释的有向聚类算法,即谱聚类算法和基于半定规划的聚类算法。我们利用矩阵扰动理论中的工具给出了谱聚类算法中被错误聚类的顶点数量的理论上限。通过在合成数据和真实世界数据上定量和定性地比较我们提出的算法与现有的有向聚类方法,从而进一步验证了我们的理论贡献。
Mar, 2024
该论文分析了动态随机块模型下的经典谱聚类算法,提出了更加精细的 DSGB 的稀疏性和平滑度之间的关系描述,同时将保证扩展到了归一化拉普拉斯算子,从而提高了矩阵谱集中度误差下界的精度。
Feb, 2020
基于模拟生物群落的算法设计实现了一种能够在聚类中平衡性能与参数优化难度的新型聚类算法 Bacteria-Farm,并且该算法还可以根据具体任务和数据分布创建不同版本,并具备排除噪声的功能。
Sep, 2023
我们提出了一个高效的基于密度的聚类算法 sDBSCAN,利用随机投影的邻域保持特性,能够快速识别核心点及其邻域,理论上,在合理条件下,sDBSCAN 的聚类结构与 DBSCAN 类似,具有较高的概率。sDBSCAN 在真实世界的百万点数据集上比其他聚类算法更快且提供更高的准确性。
Feb, 2024