通过提高唯一相关性来提升基于互信息的特征选择

Dec, 2022

通过提高唯一相关性来提升基于互信息的特征选择

Improving Mutual Information based Feature Selection by Boosting Unique Relevance

Shiyu Liu, Mehul Motani

TL;DR本文提出了一种通过增加独特关联系统来改善高维数据集下特征选择的方法，并提出了两个方案来评估独特关联性。实验结果表明，提出的方法可以在减少特征数量的同时提高分类性能，其对分类器性能的依赖性相对较低。

Abstract

mutual information (MI) based feature selection makes use of MI to evaluate each feature and eventually shortlists a relevant feature subset, in order to address issues associated with high-dimensional datasets.

mutual information feature selection unique relevance maximize relevance with minimum redundancy classifier generalization

发现论文，激发创造

一种基于增量互信息和蟑螂群优化的特征选择算法

本研究提出了一种基于增量互信息的改进群智能优化方法（IMIICSO），它利用粗糙集理论计算基于互信息的特征选择重要性，通过探索超样本的互信息计算，可以丢弃无用的特征，有效降低最优特征子集的基数，提高了高维大规模数据集的特征筛选的效率和精度。

Feb, 2023

MVMR-FS：基于最大类间差异和最小冗余的非参数特征选择算法

基于最大类间差异和最小冗余的非参数特征选择算法 (MVMR-FS)，通过引入监督和无监督的核密度估计，利用概率分布反映特征相关性和冗余性，在十种最先进方法中取得最高平均准确率，并提高 5% 至 11% 的准确率。

Jul, 2023

基于互信息的特征选择方法综述

本文介绍了信息论特征选择方法的现状，阐明了特征相关性、冗余性和补充性（协同作用）的概念，以及马尔科夫毯子。定义了最优特征选择的问题。我们描述了一个统一的理论框架，它可以使成功的启发式标准符合相应方法所做的近似。还介绍了该领域中的一些未解决问题。

Sep, 2015

关于表示学习的互信息最大化

本文讨论自监督学习中互信息最大化方法的局限性，并提出了在特征提取器架构和互信息估算器参数化中彰显归纳偏置的重要性，并展示了这种方法的成功与深度度量学习之间的联系。

Jul, 2019

通过特征的相互影响分析打开随机森林的黑匣子

本文提出了针对异构数据特征关系相互影响的两种新型方法：互济森林影响（MFI）和互济不纯性减少（MIR），并通过 p 值测试程序来选择相关和重要特征，在模拟数据集等应用中表现良好。

Apr, 2023

通过一致改进比率相结合的评估指标，及其在聚类任务中的应用

本文介绍了一种名为 Unanimous Improvement Ratio（UIR）的度量方法，它不仅补充了标准指标组合方法的不足，还可以评估指标之间的交互作用，本文还通过实验验证了该方法的有效性，并将其作为精度和召回率之间权衡的一种预测器。

Jan, 2014

不完整的多视图数据的统一视图填补和特征选择学习

多视图无监督特征选择方法 UNIFIER 能够处理不完整的多视图数据，并通过学习相似性诱导图动态恢复缺失视图，提高特征选择性能。

Jan, 2024

动态特征选择的最大化互信息学习

提出了一种基于动态特征选择（DFS）和条件互信息的特征选择方法，该方法使用了一种基于分摊优化的学习方法，并在实验中表现出优于其他特征选择方法的性能。

Jan, 2023

互信息准则的主动特征选择

本文针对标签信息有限的情况，提出了基于互信息和纯探索多臂老虎机的主动特征选择算法，并通过实验证明了其有效性。

Dec, 2020

信息修改的 K 最近邻算法

提出了一种新的分类方法，名为信息修正 KNN（IMKNN），通过引入互信息（MI）来提高 K - 最近邻算法（KNN）的性能，并从合作博弈论中的 Shapley 值概念汲取灵感，以优化价值分配。实验结果表明，在不同数据集和评判标准下，IMKNN 始终优于其他方法，突出了其在各种分类任务中的优越性能，凸显了 IMKNN 在增强 KNN 算法能力方面的潜力。

Dec, 2023