本文提出一种对分层聚类算法 (HAC) 进行公平性约束的方法,适用于任何自然的聚类公平措施和多个受保护群体,并在多个真实世界 UCI 数据集上进行了广泛的实验。
May, 2020
本文提出了一种新的鲁棒的自下而上聚类算法,并展示了在满足一定自然属性且传统算法失效的情况下,该算法可以被用来进行准确的聚类。同时,该算法也被适用于归纳设置,并在合成数据和真实数据集上的实验表明,在存在噪音时,与其他分层算法相比,该算法可以获得更好的表现。
Jan, 2014
本文提出了一种可扩展的聚合层次聚类方法,可以在不降低质量的前提下对数十亿个数据点进行聚类,并在公开的聚类基准测试集上实现了最先进的结果,同时还将层次聚类引入作为非参数聚类目标的近似算法。
Oct, 2020
本文提出了一种交互式贝叶斯算法,该算法将用户交互纳入层次聚类中,同时利用数据的几何形状通过对层次结构上的有约束的后验分布进行采样,提出了几种智能查询方式。该算法以及查询方案在真实数据上表现出了良好的结果。
Feb, 2016
本文提出了一种新的视角来考察聚类算法,侧重于恢复层次结构,并推荐了一种通过最大平均点积合并聚类的简单变体算法,该算法在数据的概率图模型下提供了真实的层次结构估计,并通过实际数据表现出比现有方法(如 UPGMA、Ward's 方法和 HDBSCAN)更出色的树恢复性能。
May, 2023
该研究提出了一种名为 HypHC 的方法,将传统的基于启发式算法的相似性层次聚类问题转化为一个离散优化问题,并通过连续松弛技术获得全局最优解,该方法通过超蜂窝嵌入实现了离散树到连续表示的映射,并采用解码算法通过叶节点嵌入到树状图的映射,实现了连续优化用于搜索离散二进制树的空间。
本文提出了一种层次凝聚图聚类算法框架并给出了完整的精确算法和近似算法,可以用于加权图的聚类问题,并通过用 $k$-NN 方法将点集转化为加权图,实现对点集的快速聚类。
Jun, 2021
本文研究了层次聚类问题,尤其是针对与平均链接聚类相关的性能和基于相似性和相异性的目标提出了新的算法,可以获得更好的结果。
Aug, 2018
该研究提出了一个基于层次聚类和谱聚类算法的框架,来解决大型数据集处理的问题,该算法在小型数据子集上运行,具有较高的性能、测量复杂度和运行时复杂度。经过广泛的实验验证,该框架实际上非常具有吸引力。
Jun, 2012
本研究提出了基于超维计算的聚类算法,通过利用编码数据的相似性确定初始聚类超维,并通过实验证明相似性传播聚类算法在八个数据集上的聚类精度优于其他算法,提高了聚类算法的准确性。
Dec, 2023