Dec, 2011

大规模相关聚类优化

TL;DR本文聚焦于 Correlation Clustering functional,它结合了数据点之间的正面和负面亲和性。文章的贡献包括两个方面,一是提供了该函数的理论分析;二是提出了新的优化算法,能够处理无法使用现有方法解决的大规模问题(>100K 变量)。通过对该函数的理论分析,发现该函数具备概率生成解释的能力,并且合理地解释了其内在的 “模型选择” 能力。此外,文章还探索了该函数和 well-known Potts 能量最小化之间的类比,这为我们提出了几种新的优化算法,这些算法利用函数的内在 “模型选择” 能力,可以自动恢复基础聚类数。与此同时,文章还介绍了两种新的应用领域:无监督人脸识别和通过粗略边界描绘实现的交互式多对象分割。