无监督特征选择方法的性能分析
通过选择最具信息量的特征并消除无关的特征,我们提出了一种新的基于差异性特征的滤波特征选择方法 ContrastFS,该方法能够在大型数据集上有效地降低计算成本,而且性能优于其他最先进的特征选择方法。
Jan, 2024
本文提出了一种高效的算法,以一种高效、紧凑的方式从候选项中发现输入特征或分类器的稀疏表示,用于大规模识别,并在训练速度和性能方面显着优于传统方法和强大的分类器,特别是在有限的训练数据的情况下。
Nov, 2014
本文综述了不同的特征选择方法及其与机器学习算法之间的关系,阐述了特征选择在数据挖掘过程中的重要性,特别是在处理数量过多的特征时,可以降低计算负担和提高机器学习任务的准确性。
Oct, 2015
本篇综述旨在回顾并总结近年来针对传统数据、结构化数据、异构数据、流数据的特征选择算法的研究进展,以及介绍一种特征选择仓库来方便算法研究,并提出一些未来研究中需要关注的问题。
Jan, 2016
本文提出了一种基于博弈理论、计算特征重要性的方法,用于无监督特征选择并消除冗余,结果表明该方法在降低冗余率的同时最大化数据信息。同时,本文还介绍了一种计算 Shapley 值的算法的近似版本,使其能够降低复杂度。
May, 2022
我们引入一种创新的特征选择框架,通过强化学习,以模拟特征和经优化的 “knockoff” 特征指导特征选择过程,从而识别出最优和有效的特征子集。
Mar, 2024
通过特征选择方法,将无关和冗余特征删除,以期获得原始特征的良好表示。本文构建了一个模型,通过集成核函数和核对齐,来解决非线性结构信息的捕捉问题。此外,还提出了一种多核学习方法,通过学习线性和非线性相似性信息,并自动生成最合适的核函数。在实验中,这两种方法在聚类结果和冗余减少方面表现优于其他经典和最先进的无监督特征选择方法。
Mar, 2024
该论文提出了一种基于无监督学习的特征选择方法,将最大间隔准则和基于稀疏性的模型整合到一个联合框架中,将类间间距和特征相关性同时考虑,通过将 Kmeans 嵌入框架中来生成伪类标签,从提取特征系数矩阵的稀疏结构来有效去除噪声和无关特征,并提出了一种收敛保证的算法以迭代地寻找最优解,对六个基准数据集进行了广泛的性能评估,实验结果表明,该方法的性能优于所有其他对比方法。
Jun, 2015
该论文介绍了一种名为 FSFC(适用于功能分类的特征选择)的新方法,它解决了在具有分类响应和纵向特征的情况下同时执行特征选择和功能数据分类的挑战。通过集成逻辑损失和功能特征来识别分类的最重要特征,该方法利用功能主成分和自适应版增广拉格朗日算法解决了最小化过程,实现了高维数据的高效处理,并且在计算时间和分类准确率方面优于其他机器学习和深度学习方法。
Jan, 2024