Nov, 2023

离散混合模型的最优聚类:二项式、泊松、块模型和多层网络

TL;DR本文研究了具有多层网络时聚类网络的基本极限。我们在混合多层随机块模型下展示了最小极大网络聚类错误率,该率采用指数形式,并由组成网络的边概率分布的Renyi散度来描述。我们提出了一种包括基于张量的初始化算法和基于似然的Lloyd算法的新型两阶段网络聚类方法。网络聚类必须与节点社区检测相结合。我们的算法实现了最小极大网络聚类错误率,在MMSBM下还允许极稀疏网络。数值模拟和实际数据实验证明了我们的方法优于现有方法。此外,我们还将我们的方法和分析框架扩展到包括二项式、泊松和多层泊松网络的离散分布混合中,研究了最小极大聚类错误率。在这些离散混合中,这些最优聚类错误率均采用Renyi散度描述的相同指数形式。我们提出的两阶段聚类算法也可以达到这些离散混合中的最小极大聚类错误率。