基于互信息的特征选择方法综述

Sep, 2015

A Review of Feature Selection Methods Based on Mutual Information

Jorge R. Vergara, Pablo A. Estévez

TL;DR本文介绍了信息论特征选择方法的现状，阐明了特征相关性、冗余性和补充性（协同作用）的概念，以及马尔科夫毯子。定义了最优特征选择的问题。我们描述了一个统一的理论框架，它可以使成功的启发式标准符合相应方法所做的近似。还介绍了该领域中的一些未解决问题。

Abstract

In this work we present a review of the state of the art of information theoretic feature selection methods. The concepts of feature relevance, redundance and complementarity (synergy) are clearly defined, as well as Markov blanket. The problem of optimal →

information theoretic feature selection markov blanket optimal selection open problems

发现论文，激发创造

特征选择的变分信息最大化

用变分分布构建了一种信息理论框架，生成互信息的下界，是一种优化特征选择的方法，实验表明该方法在信息理论特征选择中表现出色。

Jun, 2016

一种基于增量互信息和蟑螂群优化的特征选择算法

本研究提出了一种基于增量互信息的改进群智能优化方法（IMIICSO），它利用粗糙集理论计算基于互信息的特征选择重要性，通过探索超样本的互信息计算，可以丢弃无用的特征，有效降低最优特征子集的基数，提高了高维大规模数据集的特征筛选的效率和精度。

Feb, 2023

动态特征选择的条件互信息估计

本文介绍了一种基于信息论的动态特征选择方法，通过学习选择策略实现特征效益的高效获取。与现有最先进方法相比，该方法在各种数据集上都提供了一致的收益。

Jun, 2023

特征选择：关于属性间合作的视角

研究高维数据集中的特征选择方法及其发展，包括单变量相关性排名算法、关联 - 冗余折衷和基于多变量依赖性的方法，并总结文献中各种方法的贡献，同时介绍当前的问题和挑战，以确定未来的研究和发展方向。

Jun, 2023

基于信息论的公平感知特征选择度量

本篇文章提出了一种基于信息论度量和 Shapley 值函数的公平特征选择框架，以考虑特征与决策结果之间的相关性，量化了不同特征对决策结果准确性与公平性的影响，最终设计了一个特征的公平效用分数，对真实和合成数据进行了性能评估。

Jun, 2021

远程视觉多任务推理的压缩特征选择

深度模型中的特征压缩与远程推理任务之间的关联性，通过互信息作为特征重要性度量，进行硬选择和软选择实验并与其他方法进行比较，提供多目标分析来深入研究。

May, 2024

量化协同互信息

本研究介绍了一种新型协同效应计量方法并对其与其他三种信息理论方法进行了比较，研究表明本研究方法可准确测量多个变量对于单一结果变量的协同效应，同时也证明独立预测因子可以具有积极的冗余信息。

May, 2012

学习解释：模型解释的信息论视角

我们引入了实例级别特征选择作为模型解释的一种方法，基于学习一个函数来提取最具信息价值的特征集合，利用变分逼近互信息，最大化选择特征和响应变量之间的互信息，我们在各种合成和真实数据集上展示了方法的有效性，并使用定量度量和人类评估进行了验证。

Feb, 2018

一种评估特征选择和排序算法稳定性的信息论方法

特征选择是处理高维数据时的关键步骤，本文提出了一种基于 Jensen Shannon 散度的信息论方法来衡量算法的稳定性，该方法能够适用于不同的算法输出结果，并具备校正变化、上下界和确定性选择条件等优良特性。通过在控制条件下生成的数据和与其他流行度量标准的比较，验证了该稳定性度量标准的实用性和优势。在实际问题中，该方法对于食物质量评估具有潜在的稳定性评估能力。

Feb, 2024

互信息度量下针对无参数和健壮特征选择的重新采样方法

本研究提出了一种将互信息准则与前向特征选择策略相结合的方法，在平衡所选特征子集的最优性和计算时间方面具有很好的折衷。同时，为了解决互信息估计器的参数设置和决定何时停止前向过程等问题，使用了重采样方法、K 交叉验证和置换检验。这一程序在合成数据集和实际案例中进行了演示。

Sep, 2007