本文介绍了一种基于信息论的动态特征选择方法,通过学习选择策略实现特征效益的高效获取。与现有最先进方法相比,该方法在各种数据集上都提供了一致的收益。
Jun, 2023
研究如何在自动化特征选择中平衡有效性和效率。通过提出一个新的交互式增强特征选择框架,将特征选择问题形式化为交互式强化学习框架,该框架通过自我探索经验及多元化外部技术指导训练器,从而加速学习。此外,该研究利用多种不同搜索策略进行训练,并提出了一种混合教学策略来帮助智能体学习更广泛的知识。最后,对真实世界数据集进行广泛实验以展示该方法的性能改进。
Aug, 2020
本研究提出了一种基于增量互信息的改进群智能优化方法(IMIICSO),它利用粗糙集理论计算基于互信息的特征选择重要性,通过探索超样本的互信息计算,可以丢弃无用的特征,有效降低最优特征子集的基数,提高了高维大规模数据集的特征筛选的效率和精度。
Feb, 2023
用变分分布构建了一种信息理论框架,生成互信息的下界,是一种优化特征选择的方法,实验表明该方法在信息理论特征选择中表现出色。
Jun, 2016
本文针对标签信息有限的情况,提出了基于互信息和纯探索多臂老虎机的主动特征选择算法,并通过实验证明了其有效性。
Dec, 2020
该研究探讨了在网络数据采集基础上,采用机器学习和深度学习方法,结合三种特征选择技术去构建出更快,更易解释,更准确的入侵检测系统,结果显示 Bat 算法得到了最高效的结果。
Mar, 2023
本文介绍了第一个针对物联网环境中分布式多标签数据集合的联合多标签特征选择方法 FMLFS,通过对边缘服务器上的度量的聚合和 Pareto 双目标策略以及拥挤距离策略,将排序后的特征返回给物联网设备,评估结果表明 FMLFS 在性能、时间复杂度和通信成本等方面优于其他五个可比较的方法。
May, 2024
本文介绍了信息论特征选择方法的现状,阐明了特征相关性、冗余性和补充性(协同作用)的概念,以及马尔科夫毯子。定义了最优特征选择的问题。我们描述了一个统一的理论框架,它可以使成功的启发式标准符合相应方法所做的近似。还介绍了该领域中的一些未解决问题。
Sep, 2015
研究采用强化学习优化时间序列场景下的动态特征选择方法,提高临床预测监测中的数据挖掘效果。
我们引入了实例级别特征选择作为模型解释的一种方法,基于学习一个函数来提取最具信息价值的特征集合,利用变分逼近互信息,最大化选择特征和响应变量之间的互信息,我们在各种合成和真实数据集上展示了方法的有效性,并使用定量度量和人类评估进行了验证。
Feb, 2018