交互式贝叶斯分层聚类

Feb, 2016

Interactive Bayesian Hierarchical Clustering

Sharad Vikram, Sanjoy Dasgupta

TL;DR本文提出了一种交互式贝叶斯算法，该算法将用户交互纳入层次聚类中，同时利用数据的几何形状通过对层次结构上的有约束的后验分布进行采样，提出了几种智能查询方式。该算法以及查询方案在真实数据上表现出了良好的结果。

Abstract

clustering is a powerful tool in data analysis, but it is often difficult to find a grouping that aligns with a user's needs. To address this, several methods incorporate constraints obtained from users into clustering<

clustering hierarchical clustering bayesian algorithm user interaction querying schemes

发现论文，激发创造

带拒绝选项的聚类：交互式聚类作为贝叶斯先验引导

使用贝叶斯框架下的先验引导方法，基于一种简单的交互式反馈机制的数据探索中的聚类方法 TINDER，能够帮助数据分析师产生多个品质等价的不同的聚类结果。

Jun, 2016

具有结构约束的分层聚类

本文研究了带有结构约束条件的层次聚类问题，提出了两种基于优化视角的自顶向下算法，并且通过公式化约束性正则化的方法在存在冲突先验信息的情况下得出了良好的解，同时探讨了基于差异性信息变化的目标函数的变形并进一步优化了当前技术，最后将该方法应用于实际数据集的分类学应用

May, 2018

强健层次聚类

本文提出了一种新的鲁棒的自下而上聚类算法，并展示了在满足一定自然属性且传统算法失效的情况下，该算法可以被用来进行准确的聚类。同时，该算法也被适用于归纳设置，并在合成数据和真实数据集上的实验表明，在存在噪音时，与其他分层算法相比，该算法可以获得更好的表现。

Jan, 2014

层次聚类的数据聚合

使用 BETULA 数据聚合算法进行数据聚类，使得在资源受限的系统上使用层次凝聚聚类方法成为可能，仅在聚类质量上有轻微损失，并且允许对非常大的数据集进行探索性数据分析。

Sep, 2023

贝叶斯凝聚聚类与同系合并

本文提出了一种新的贝叶斯模型，它基于一种树形结构的先验概率，称为金曼共同祖先，发展出了新的贪婪和顺序蒙特卡罗推断算法，用于自下而上的聚合式层次聚类。实验证明，我们的算法优于其他算法，并在文档聚类和语言学上证明了我们的方法。

Jul, 2009

可解释聚类的最优决策树

本文提出了一种新的基于 SAT 的可解释聚类框架，支持聚类约束，同时提供强有力的解决方案质量理论保证，并给出了关于解释性和满足用户约束之间权衡的新见解。

Jan, 2023

贝叶斯玫瑰树

本文探讨一种基于贝叶斯方法的层次聚类算法，它能够在每个结点上产生任意分支结构的玫瑰树，并通过一种计算有效的贪心凝聚算法来找到具有高边际似然值的玫瑰树，最终实验证明，玫瑰树是数据的较好模型。

Mar, 2012

通过图粗化和最优割方法的受限层次聚类

通过在短句设置中提取和总结相关信息，我们研究了以层次化方式对单词进行聚类的问题，特别是关注具有水平和垂直结构约束的聚类问题，我们通过将问题分为两个步骤来克服现有技术的瓶颈，首先，将其作为一个有软约束的正则化最小二乘问题来引导顺序图粗化算法的结果朝向水平可行解集，然后通过计算基于可用约束的最优截断高度从生成的层次树中提取平坦的聚类，我们展示了这种方法相对于现有算法具有很好的比较性能且计算上轻量级。

Dec, 2023

使用互信息的分层聚类

本文提出了一种名为 MIC 算法的层次聚类数据的方法，采用相互信息作为相似度度量，并利用其聚组特性。将此方法应用于从线粒体 DNA 序列构建系统发育树以及独立成分分析（ICA）的输出。

Nov, 2003

基于贝叶斯非参数的 k-means 聚类新算法再探

本文从贝叶斯非参数的角度出发，重新审视了 k-means 聚类算法。通过分析 Dirichlet 过程混合物的 Gibbs 抽样算法，我们发现这个算法在极限下接近于硬聚类算法，可以优雅且单调地最小化一个类似 k-means 的聚类目标，包括对聚类数的惩罚。我们将这个方法推广到了多个数据集的聚类情况，并讨论了进一步的扩展，包括门槛特征向量的光谱松弛和在图中不需要固定聚类数的归一化割图聚类算法。

Nov, 2011