使用贝叶斯框架下的先验引导方法,基于一种简单的交互式反馈机制的数据探索中的聚类方法 TINDER,能够帮助数据分析师产生多个品质等价的不同的聚类结果。
Jun, 2016
本文研究了带有结构约束条件的层次聚类问题,提出了两种基于优化视角的自顶向下算法,并且通过公式化约束性正则化的方法在存在冲突先验信息的情况下得出了良好的解,同时探讨了基于差异性信息变化的目标函数的变形并进一步优化了当前技术,最后将该方法应用于实际数据集的分类学应用
May, 2018
本文提出了一种新的鲁棒的自下而上聚类算法,并展示了在满足一定自然属性且传统算法失效的情况下,该算法可以被用来进行准确的聚类。同时,该算法也被适用于归纳设置,并在合成数据和真实数据集上的实验表明,在存在噪音时,与其他分层算法相比,该算法可以获得更好的表现。
Jan, 2014
使用 BETULA 数据聚合算法进行数据聚类,使得在资源受限的系统上使用层次凝聚聚类方法成为可能,仅在聚类质量上有轻微损失,并且允许对非常大的数据集进行探索性数据分析。
Sep, 2023
本文提出了一种新的贝叶斯模型,它基于一种树形结构的先验概率,称为金曼共同祖先,发展出了新的贪婪和顺序蒙特卡罗推断算法,用于自下而上的聚合式层次聚类。实验证明,我们的算法优于其他算法,并在文档聚类和语言学上证明了我们的方法。
Jul, 2009
本文提出了一种新的基于 SAT 的可解释聚类框架,支持聚类约束,同时提供强有力的解决方案质量理论保证,并给出了关于解释性和满足用户约束之间权衡的新见解。
Jan, 2023
本文探讨一种基于贝叶斯方法的层次聚类算法,它能够在每个结点上产生任意分支结构的玫瑰树,并通过一种计算有效的贪心凝聚算法来找到具有高边际似然值的玫瑰树,最终实验证明,玫瑰树是数据的较好模型。
Mar, 2012
通过在短句设置中提取和总结相关信息,我们研究了以层次化方式对单词进行聚类的问题,特别是关注具有水平和垂直结构约束的聚类问题,我们通过将问题分为两个步骤来克服现有技术的瓶颈,首先,将其作为一个有软约束的正则化最小二乘问题来引导顺序图粗化算法的结果朝向水平可行解集,然后通过计算基于可用约束的最优截断高度从生成的层次树中提取平坦的聚类,我们展示了这种方法相对于现有算法具有很好的比较性能且计算上轻量级。
Dec, 2023
本文提出了一种名为 MIC 算法的层次聚类数据的方法,采用相互信息作为相似度度量,并利用其聚组特性。将此方法应用于从线粒体 DNA 序列构建系统发育树以及独立成分分析(ICA)的输出。
Nov, 2003
本文从贝叶斯非参数的角度出发,重新审视了 k-means 聚类算法。通过分析 Dirichlet 过程混合物的 Gibbs 抽样算法,我们发现这个算法在极限下接近于硬聚类算法,可以优雅且单调地最小化一个类似 k-means 的聚类目标,包括对聚类数的惩罚。我们将这个方法推广到了多个数据集的聚类情况,并讨论了进一步的扩展,包括门槛特征向量的光谱松弛和在图中不需要固定聚类数的归一化割图聚类算法。
Nov, 2011