基于互信息的特征选择方法综述
本研究提出了一种基于增量互信息的改进群智能优化方法(IMIICSO),它利用粗糙集理论计算基于互信息的特征选择重要性,通过探索超样本的互信息计算,可以丢弃无用的特征,有效降低最优特征子集的基数,提高了高维大规模数据集的特征筛选的效率和精度。
Feb, 2023
研究高维数据集中的特征选择方法及其发展,包括单变量相关性排名算法、关联 - 冗余折衷和基于多变量依赖性的方法,并总结文献中各种方法的贡献,同时介绍当前的问题和挑战,以确定未来的研究和发展方向。
Jun, 2023
本篇文章提出了一种基于信息论度量和 Shapley 值函数的公平特征选择框架,以考虑特征与决策结果之间的相关性,量化了不同特征对决策结果准确性与公平性的影响,最终设计了一个特征的公平效用分数,对真实和合成数据进行了性能评估。
Jun, 2021
本研究介绍了一种新型协同效应计量方法并对其与其他三种信息理论方法进行了比较,研究表明本研究方法可准确测量多个变量对于单一结果变量的协同效应,同时也证明独立预测因子可以具有积极的冗余信息。
May, 2012
我们引入了实例级别特征选择作为模型解释的一种方法,基于学习一个函数来提取最具信息价值的特征集合,利用变分逼近互信息,最大化选择特征和响应变量之间的互信息,我们在各种合成和真实数据集上展示了方法的有效性,并使用定量度量和人类评估进行了验证。
Feb, 2018
特征选择是处理高维数据时的关键步骤,本文提出了一种基于 Jensen Shannon 散度的信息论方法来衡量算法的稳定性,该方法能够适用于不同的算法输出结果,并具备校正变化、上下界和确定性选择条件等优良特性。通过在控制条件下生成的数据和与其他流行度量标准的比较,验证了该稳定性度量标准的实用性和优势。在实际问题中,该方法对于食物质量评估具有潜在的稳定性评估能力。
Feb, 2024
本研究提出了一种将互信息准则与前向特征选择策略相结合的方法,在平衡所选特征子集的最优性和计算时间方面具有很好的折衷。同时,为了解决互信息估计器的参数设置和决定何时停止前向过程等问题,使用了重采样方法、K 交叉验证和置换检验。这一程序在合成数据集和实际案例中进行了演示。
Sep, 2007