本文提出了一种新的鲁棒的自下而上聚类算法,并展示了在满足一定自然属性且传统算法失效的情况下,该算法可以被用来进行准确的聚类。同时,该算法也被适用于归纳设置,并在合成数据和真实数据集上的实验表明,在存在噪音时,与其他分层算法相比,该算法可以获得更好的表现。
Jan, 2014
使用 BETULA 数据聚合算法进行数据聚类,使得在资源受限的系统上使用层次凝聚聚类方法成为可能,仅在聚类质量上有轻微损失,并且允许对非常大的数据集进行探索性数据分析。
Sep, 2023
本文提出一种对分层聚类算法 (HAC) 进行公平性约束的方法,适用于任何自然的聚类公平措施和多个受保护群体,并在多个真实世界 UCI 数据集上进行了广泛的实验。
May, 2020
本文提出了一种新的视角来考察聚类算法,侧重于恢复层次结构,并推荐了一种通过最大平均点积合并聚类的简单变体算法,该算法在数据的概率图模型下提供了真实的层次结构估计,并通过实际数据表现出比现有方法(如 UPGMA、Ward's 方法和 HDBSCAN)更出色的树恢复性能。
May, 2023
该研究提出了一个基于层次聚类和谱聚类算法的框架,来解决大型数据集处理的问题,该算法在小型数据子集上运行,具有较高的性能、测量复杂度和运行时复杂度。经过广泛的实验验证,该框架实际上非常具有吸引力。
Jun, 2012
本文研究在传统的分类中引入公正性准则,探索公平的分层聚类算法以解决机器学习系统中的过度表达问题。我们为多种自然目标提供了简单高效的算法,能够找到一个合理的公正的分层聚类,同时只会带来微不足道的目标损失。
Jun, 2020
本文研究了层次聚类问题,尤其是针对与平均链接聚类相关的性能和基于相似性和相异性的目标提出了新的算法,可以获得更好的结果。
Aug, 2018
本篇论文研究层次聚类的优化问题,通过提出一些可靠的任务目标函数并对实际算法进行分析,提供了更优的算法以及性能表现。
Apr, 2017
这篇论文通过 Bregman 距离对凸函数进行聚类,引入几何平滑技术处理聚类异常,并基于过完备表示的指数家族模型发展 Bregman 距离算法。
本文提出了一种层次凝聚图聚类算法框架并给出了完整的精确算法和近似算法,可以用于加权图的聚类问题,并通过用 $k$-NN 方法将点集转化为加权图,实现对点集的快速聚类。
Jun, 2021