实现多目标特征选择可解释性的数据科学流程
为解决大规模特征选择问题,本文提出了一种新的二元多目标坐标搜索(MOCS)算法,该算法在真实世界的大规模数据集上展现出显著的优越性,并且比 NSGA-II 算法更快速、更高效地解决特征选择问题。
Feb, 2024
本研究提出了 DR-MOFS,将网络入侵检测中的特征选择问题建模为一个三目标优化问题,通过使用多目标进化算法同时优化特征数量、准确率和检测率,实验结果表明,该方法在大多数情况下优于以前的方法,即减少特征数量,提高准确率和检测率。
Jun, 2024
本研究利用改进的 PAES 方法,采用高级概率方案以及一种新策略,较之现有的 state-of-the-art 的方法在多个真实数据集上显著提高了多目标特征选择的性能,并在探索解决方案的速度和可靠性方面取得了优异的表现。
Nov, 2022
通过在农业环境中使用多标签来设计目标特定的特征交互方案,以寻找最佳特征组合,本研究提出了一种与全局敏感性分析相结合的特征解释方法,可在多目标预测中实现组合优化,初步实验结果表明基于解释的方法能够在较少迭代次数内找到减少病原体存在的特征组合。
Feb, 2024
多视角特征选择(MvFS)是一个选择推荐系统中信息性特征的方法,通过使用一个多视角网络并采用独立的重要性评分策略,以更加均衡的方式选择特征,解决了传统方法中易受主要特征偏倚的问题,实验证明其相较于现有方法具有更高的效果。
Sep, 2023
本研究提出了一种不受模型约束的框架,可以同时优化监督式机器学习模型在表格数据上的预测性能和可解释性,其中可解释性通过特征稀疏性、特征交互稀疏性以及非单调特征效应的稀疏性进行量化。
Jul, 2023
特征选择是一种流行的方法,可以获得小型、可解释且高度准确的预测模型。本文介绍了一种名为 “替代特征选择” 的方法,并将其形式化为一个优化问题。我们定义了替代特征集合的约束条件,并允许用户控制替代特征的数量和差异性。进一步分析了该优化问题的复杂性并证明了其 NP-hardness。最后,我们使用 30 个分类数据集评估了替代特征选择的效果,并观察到替代特征集合可能具有较高的预测质量,并分析了影响这一结果的几个因素。
Jul, 2023
该论文提出了一个面向数据的 AI 框架,可以自动选择重要特征,实现自动发现不同的数据子组并提高检测性能。通过在 MIMIC-III 和 Allstate Claims 公开数据集上的验证,该框架比现有的六种特征选择方法减少了 81 倍和 104 倍的特征选择时间,并实现了有竞争力的检测性能。
Mar, 2022
DOSA-MO 是一种新型的多目标优化封装算法,它通过学习原始估计、其方差以及解集大小如何预测过度估计,并调整期望值以在优化期间改进解集的组成,验证表明 DOSA-MO 基于三个转录组数据集对肾癌和乳腺癌进行生物标志物识别改进了基于遗传算法的最新研究在预测癌症亚型和 / 或患者总存活率时的性能。
Dec, 2023