May, 2013

数据聚类的特权信息

TL;DR本文研究了 Vapnik 的主人公学习理念及其在无监督学习中使用的相关学习。通过提出的 aRi-MAX 方法,KMeans 算法的稳定性得到了改善,并在人工数据集上实现了最佳聚类解的识别。随后,提出了一种基于信息论点积的算法 P-Dot,能够利用各种聚类技巧,单独或组合使用,以融合特权数据和技术数据,以提高聚类效果。文中通过对数字识别任务的应用验证了这些方法在实际情况下的适用性。