Dec, 2019

可扩展的树嫁接层次聚类

TL;DRGrinch是一种新的算法,用于支持具有任意相似度的非贪婪层次聚类,该算法以其旋转和嫁接子程序为关键组件,可以快速重新配置层次结构,支持发现具有复杂结构的聚类,并且在数据到达顺序独立的情况下能够保证生成包含基本真值的聚类树。该算法在基准和作者共现数据集上(使用标准和学习链接函数)得到了良好的实验结果,其准确性超过了其他可扩展方法,并快了数个数量级以上。