本文采用公理化方法研究聚类理论,提出一套符合逻辑的公理并通过对单联通聚类函数的抽象属性进行分类,为用户提供了选择合适聚类范例的指导。
May, 2012
本文提出了一个基于度量空间的“好聚类”的理论框架,展示了如果存在好的聚类,则在许多情况下可以轻易地找到它,因此与流行观点相反,聚类不应被视为一项艰苦的任务。
本文研究了基于稳定性假设的交互式聚类算法设计,算法开始于任意初始聚类,只进行每步的局部更改;我们证明在这种约束条件下,仍然可以设计出具有可证明高效和准确聚类能力的算法,并在真实数据上进行了实证。
Dec, 2013
本文研究了增量聚类方法的优缺点,发现增量聚类方法相对于批处理模型存在明显的劣势,即无法识别一类基本的聚类结构,但是可以通过增加聚类实现对增量聚类方法的限制的克服。
Jun, 2014
本文探讨了聚类的困难性和可聚类性的主题。作者提出了以前的研究和对聚类簇合法性的批判性评估。虽然我们相信聚类只有在数据不重要时才是困难的,但我们认为这个CDNM论点仍远未得到正式的实质性证明。在阐述了聚类簇合法性的基本要求后,本文评估了这些要求的现有结果,并概述了一些研究挑战和开放问题。
Jan, 2015
本文提出了一种交互式贝叶斯算法,该算法将用户交互纳入层次聚类中,同时利用数据的几何形状通过对层次结构上的有约束的后验分布进行采样,提出了几种智能查询方式。该算法以及查询方案在真实数据上表现出了良好的结果。
Feb, 2016
本文研究了带有噪声查询的聚类问题,提供了信息理论下限以及与之匹配的新算法,并介绍了在众包、社交网络和随机块模型中应用的情况。
Jun, 2017
使用改进的参数分布推导出来自Dirichlet-Multinomial分布的Powered中餐厅过程,以解决Dirichlet先验不一定是建模数据的最佳选择的问题,并提供直接控制“富人越富”先验重要性的新公式。
Apr, 2021
提出了一种计算理论和半监督聚类算法,将聚类定义为根据所选的聚类原则和度量方法获得数据分组,使每个组不包含异常值,所有其他示例被认为是边缘点,孤立的异常值、异常簇或未知簇。
Jun, 2023
我们提出了一种基于解释驱动的集群选择的解释可调的约束聚类方法,该方法能够生成高质量的且可解释的聚类,其中聚类结果考虑了特征的覆盖率和区分度,并能够整合领域专家知识和用户约束。
Mar, 2024