本研究提出了一种基于增量互信息的改进群智能优化方法(IMIICSO),它利用粗糙集理论计算基于互信息的特征选择重要性,通过探索超样本的互信息计算,可以丢弃无用的特征,有效降低最优特征子集的基数,提高了高维大规模数据集的特征筛选的效率和精度。
Feb, 2023
基于最大类间差异和最小冗余的非参数特征选择算法 (MVMR-FS),通过引入监督和无监督的核密度估计,利用概率分布反映特征相关性和冗余性,在十种最先进方法中取得最高平均准确率,并提高 5% 至 11% 的准确率。
Jul, 2023
本文介绍了信息论特征选择方法的现状,阐明了特征相关性、冗余性和补充性(协同作用)的概念,以及马尔科夫毯子。定义了最优特征选择的问题。我们描述了一个统一的理论框架,它可以使成功的启发式标准符合相应方法所做的近似。还介绍了该领域中的一些未解决问题。
Sep, 2015
本文讨论自监督学习中互信息最大化方法的局限性,并提出了在特征提取器架构和互信息估算器参数化中彰显归纳偏置的重要性,并展示了这种方法的成功与深度度量学习之间的联系。
Jul, 2019
本文提出了针对异构数据特征关系相互影响的两种新型方法:互济森林影响(MFI)和互济不纯性减少(MIR),并通过 p 值测试程序来选择相关和重要特征,在模拟数据集等应用中表现良好。
Apr, 2023
本文介绍了一种名为 Unanimous Improvement Ratio(UIR)的度量方法,它不仅补充了标准指标组合方法的不足,还可以评估指标之间的交互作用,本文还通过实验验证了该方法的有效性,并将其作为精度和召回率之间权衡的一种预测器。
Jan, 2014
多视图无监督特征选择方法 UNIFIER 能够处理不完整的多视图数据,并通过学习相似性诱导图动态恢复缺失视图,提高特征选择性能。
Jan, 2024
提出了一种基于动态特征选择(DFS)和条件互信息的特征选择方法,该方法使用了一种基于分摊优化的学习方法,并在实验中表现出优于其他特征选择方法的性能。
Jan, 2023
本文针对标签信息有限的情况,提出了基于互信息和纯探索多臂老虎机的主动特征选择算法,并通过实验证明了其有效性。
Dec, 2020
提出了一种新的分类方法,名为信息修正 KNN(IMKNN),通过引入互信息(MI)来提高 K - 最近邻算法(KNN)的性能,并从合作博弈论中的 Shapley 值概念汲取灵感,以优化价值分配。实验结果表明,在不同数据集和评判标准下,IMKNN 始终优于其他方法,突出了其在各种分类任务中的优越性能,凸显了 IMKNN 在增强 KNN 算法能力方面的潜力。
Dec, 2023