KDDNov, 2015

大数据可伸缩准确的在线特征选择

TL;DR本文介绍了一个在线高度可扩展的特征选择算法 - SAOLA,它使用新颖的成对比较技术,在线维护一个简便的模型。并提出了一个扩展的 SAOLA 算法,即在线群组特征选择算法,能够同时稀疏地维护一组特征组合和单个特征。实验证明,SAOLA 和群组 SAOLA 算法在高度维度的数据集上均具有良好的性能。