Oct, 2023

低密度分离假设下监督学习和无监督学习之间的随机矩阵分析

TL;DR我们提出了一个理论框架,用于分析高维情况下基于低密度分离假设的半监督分类。我们介绍了QLDS,一个线性分类模型,其中低密度分离假设通过二次边界最大化来实现。该算法具有显式解和丰富的理论性质,我们证明了我们算法的特殊情况是有监督情况下的最小二乘支持向量机,完全非监督情况下的谱聚类以及一类半监督图方法。因此,QLDS在这些有监督和无监督学习方法之间建立了一个平滑的桥梁。利用随机矩阵理论的最新进展,我们正式推导了在渐近情况下的分类误差的理论评估。作为应用,我们得出一个超参数选择策略,找到在我们学习准则的有监督项和无监督项之间的最佳平衡。最后,我们提供了我们框架的广泛示例,以及在几个基准测试上的实验研究,证明了QLDS在计算效率更高的同时,在超参数选择上优于交叉验证,表明随机矩阵理论在半监督模型选择中具有很大的潜力。