带拒绝选项的聚类：交互式聚类作为贝叶斯先验引导

Jun, 2016

带拒绝选项的聚类：交互式聚类作为贝叶斯先验引导

Clustering with a Reject Option: Interactive Clustering as Bayesian Prior Elicitation

Akash Srivastava, James Zou, Ryan P. Adams, Charles Sutton

TL;DR使用贝叶斯框架下的先验引导方法，基于一种简单的交互式反馈机制的数据探索中的聚类方法TINDER，能够帮助数据分析师产生多个品质等价的不同的聚类结果。

Abstract

A good clustering can help a data analyst to explore and understand a data set, but what constitutes a good clustering may depend on domain-specific and application-specific criteria. These criteria can be diffic

发现论文，激发创造

聚类的唯一性定理

本文采用公理化方法研究聚类理论，提出一套符合逻辑的公理并通过对单联通聚类函数的抽象属性进行分类，为用户提供了选择合适聚类范例的指导。

May, 2012

只有在聚类无关紧要时才很困难

本文提出了一个基于度量空间的“好聚类”的理论框架，展示了如果存在好的聚类，则在许多情况下可以轻易地找到它，因此与流行观点相反，聚类不应被视为一项艰苦的任务。

May, 2012

交互式聚类的本地算法

本文研究了基于稳定性假设的交互式聚类算法设计，算法开始于任意初始聚类，只进行每步的局部更改；我们证明在这种约束条件下，仍然可以设计出具有可证明高效和准确聚类能力的算法，并在真实数据上进行了实证。

Dec, 2013

增量聚类：额外聚类的情况

本文研究了增量聚类方法的优缺点，发现增量聚类方法相对于批处理模型存在明显的劣势，即无法识别一类基本的聚类结构，但是可以通过增加聚类实现对增量聚类方法的限制的克服。

Jun, 2014

在聚类性假设下聚类的计算可行性

本文探讨了聚类的困难性和可聚类性的主题。作者提出了以前的研究和对聚类簇合法性的批判性评估。虽然我们相信聚类只有在数据不重要时才是困难的，但我们认为这个CDNM论点仍远未得到正式的实质性证明。在阐述了聚类簇合法性的基本要求后，本文评估了这些要求的现有结果，并概述了一些研究挑战和开放问题。

Jan, 2015

交互式贝叶斯分层聚类

本文提出了一种交互式贝叶斯算法，该算法将用户交互纳入层次聚类中，同时利用数据的几何形状通过对层次结构上的有约束的后验分布进行采样，提出了几种智能查询方式。该算法以及查询方案在真实数据上表现出了良好的结果。

Feb, 2016

带噪声查询的聚类

本文研究了带有噪声查询的聚类问题，提供了信息理论下限以及与之匹配的新算法，并介绍了在众包、社交网络和随机块模型中应用的情况。

Jun, 2017

使用动力狄利克雷过程控制贝叶斯聚类中先验偏好的重要程度

使用改进的参数分布推导出来自Dirichlet-Multinomial分布的Powered中餐厅过程，以解决Dirichlet先验不一定是建模数据的最佳选择的问题，并提供直接控制“富人越富”先验重要性的新公式。

Apr, 2021

聚类的计算理论与半监督算法

提出了一种计算理论和半监督聚类算法，将聚类定义为根据所选的聚类原则和度量方法获得数据分组，使每个组不包含异常值，所有其他示例被认为是边缘点，孤立的异常值、异常簇或未知簇。

Jun, 2023

走向可解释聚类：基于约束声明的方法

我们提出了一种基于解释驱动的集群选择的解释可调的约束聚类方法，该方法能够生成高质量的且可解释的聚类，其中聚类结果考虑了特征的覆盖率和区分度，并能够整合领域专家知识和用户约束。

Mar, 2024