Sep, 2010

稀疏监督学习中的安全特征消除

TL;DR本文研究了在凸损失函数和 $l_1$ 正则化惩罚下解决监督学习问题中快速消除特征的方法,该方法不是启发式的,只消除在解决学习问题后确保不存在的特征。我们的方法适用于支持向量机分类,逻辑回归和最小二乘等一类问题。我们在文本分类数据集上应用方法,观察到降维了,特别是在寻找非常稀疏的分类器时,降低了求解学习问题所需的计算工作量。这使我们可以立即扩展现有算法的范围,从而使我们能够运行以前无法处理的数据量。