May, 2023

使用点积进行分层聚类可以恢复隐藏的树状结构

TL;DR本文提出了一种新的视角来考察聚类算法,侧重于恢复层次结构,并推荐了一种通过最大平均点积合并聚类的简单变体算法,该算法在数据的概率图模型下提供了真实的层次结构估计,并通过实际数据表现出比现有方法(如 UPGMA、Ward's 方法和 HDBSCAN)更出色的树恢复性能。