无监督特征选择方法的性能分析

Jun, 2013

Performance analysis of unsupervised feature selection methods

A. Nisthana Parveen, H. Hannah Inbarani, E.N. Sathishkumar

TL;DR本文比较了不同算法在特征选择方面的效果，结果表明 PCA、Rough PCA、USQR 和 EDR 算法能够快速筛选出对数据分类最相关的特征。

Abstract

feature selection (FS) is a process which attempts to select more informative features. In some cases, too many redundant or irrelevant features may overpower main features for classification. →

feature selection classification principal component analysis rough pca empirical distribution ranking

发现论文，激发创造

一种用于机器学习中的高维数据集的基于对比的特征选择算法

通过选择最具信息量的特征并消除无关的特征，我们提出了一种新的基于差异性特征的滤波特征选择方法 ContrastFS，该方法能够在大型数据集上有效地降低计算成本，而且性能优于其他最先进的特征选择方法。

Jan, 2024

特征合奏：判别特征选择遇见无监督聚类

本文提出了一种高效的算法，以一种高效、紧凑的方式从候选项中发现输入特征或分类器的稀疏表示，用于大规模识别，并在训练速度和性能方面显着优于传统方法和强大的分类器，特别是在有限的训练数据的情况下。

Nov, 2014

特征选择调查

本文综述了不同的特征选择方法及其与机器学习算法之间的关系，阐述了特征选择在数据挖掘过程中的重要性，特别是在处理数量过多的特征时，可以降低计算负担和提高机器学习任务的准确性。

Oct, 2015

基于自编码器的无监督特征选择

本研究介绍了一种基于自编码器回归和组稀疏任务的无监督特征选择方法 AEFS，能够更灵活地选取高维数据中最重要的特征，实验结果表明该方法优于现有的方法。

Oct, 2017

特征选择：基于数据的视角

本篇综述旨在回顾并总结近年来针对传统数据、结构化数据、异构数据、流数据的特征选择算法的研究进展，以及介绍一种特征选择仓库来方便算法研究，并提出一些未来研究中需要关注的问题。

Jan, 2016

基于集合博弈理论的无监督分类数据特征排序

本文提出了一种基于博弈理论、计算特征重要性的方法，用于无监督特征选择并消除冗余，结果表明该方法在降低冗余率的同时最大化数据信息。同时，本文还介绍了一种计算 Shapley 值的算法的近似版本，使其能够降低复杂度。

May, 2022

通过单个预训练的加强代理指导的仿制品特征选择

我们引入一种创新的特征选择框架，通过强化学习，以模拟特征和经优化的 “knockoff” 特征指导特征选择过程，从而识别出最优和有效的特征子集。

Mar, 2024

基于矩阵分解的无监督特征选择的核对齐

通过特征选择方法，将无关和冗余特征删除，以期获得原始特征的良好表示。本文构建了一个模型，通过集成核函数和核对齐，来解决非线性结构信息的捕捉问题。此外，还提出了一种多核学习方法，通过学习线性和非线性相似性信息，并自动生成最合适的核函数。在实验中，这两种方法在聚类结果和冗余减少方面表现优于其他经典和最先进的无监督特征选择方法。

Mar, 2024

无监督特征分析及类间间隔优化

该论文提出了一种基于无监督学习的特征选择方法，将最大间隔准则和基于稀疏性的模型整合到一个联合框架中，将类间间距和特征相关性同时考虑，通过将 Kmeans 嵌入框架中来生成伪类标签，从提取特征系数矩阵的稀疏结构来有效去除噪声和无关特征，并提出了一种收敛保证的算法以迭代地寻找最优解，对六个基准数据集进行了广泛的性能评估，实验结果表明，该方法的性能优于所有其他对比方法。

Jun, 2015

功能数据分类的特征选择

该论文介绍了一种名为 FSFC（适用于功能分类的特征选择）的新方法，它解决了在具有分类响应和纵向特征的情况下同时执行特征选择和功能数据分类的挑战。通过集成逻辑损失和功能特征来识别分类的最重要特征，该方法利用功能主成分和自适应版增广拉格朗日算法解决了最小化过程，实现了高维数据的高效处理，并且在计算时间和分类准确率方面优于其他机器学习和深度学习方法。

Jan, 2024