实现多目标特征选择可解释性的数据科学流程

Nov, 2023

实现多目标特征选择可解释性的数据科学流程

A data-science pipeline to enable the Interpretability of Many-Objective Feature Selection

Uchechukwu F. Njoku, Alberto Abelló, Besim Bilalli, Gianluca Bontempi

TL;DR本研究提出了一种原创方法，通过后处理和可视化来支持数据科学家解释和比较 MOFS 结果，从而帮助其选择最佳特征子集。

Abstract

many-objective feature selection (mofs) approaches use four or more objectives to determine the relevance of a subset of features in a supervised learning task. As a consequence, →

many-objective feature selection mofs data scientist post-processing visualisation

发现论文，激发创造

多目标二进制坐标搜索特征选择

为解决大规模特征选择问题，本文提出了一种新的二元多目标坐标搜索（MOCS）算法，该算法在真实世界的大规模数据集上展现出显著的优越性，并且比 NSGA-II 算法更快速、更高效地解决特征选择问题。

Feb, 2024

网络入侵检测中注重检测率的多目标进化特征选择

本研究提出了 DR-MOFS，将网络入侵检测中的特征选择问题建模为一个三目标优化问题，通过使用多目标进化算法同时优化特征数量、准确率和检测率，实验结果表明，该方法在大多数情况下优于以前的方法，即减少特征数量，提高准确率和检测率。

Jun, 2024

一种元启发式多目标交互感知特征选择方法

本研究利用改进的 PAES 方法，采用高级概率方案以及一种新策略，较之现有的 state-of-the-art 的方法在多个真实数据集上显著提高了多目标特征选择的性能，并在探索解决方案的速度和可靠性方面取得了优异的表现。

Nov, 2022

探索多目标特征关联的解释性

通过在农业环境中使用多标签来设计目标特定的特征交互方案，以寻找最佳特征组合，本研究提出了一种与全局敏感性分析相结合的特征解释方法，可在多目标预测中实现组合优化，初步实验结果表明基于解释的方法能够在较少迭代次数内找到减少病原体存在的特征组合。

Feb, 2024

MvFS: 多视图特征选择推荐系统

多视角特征选择（MvFS）是一个选择推荐系统中信息性特征的方法，通过使用一个多视角网络并采用独立的重要性评分策略，以更加均衡的方式选择特征，解决了传统方法中易受主要特征偏倚的问题，实验证明其相较于现有方法具有更高的效果。

Sep, 2023

多视角特征选择的多目标遗传算法

本文提出一种基于遗传算法的多视图多目标特征选择方法，并针对多视图数据的分类任务，取得了优于其他方法的性能和解释性表现。

May, 2023

表格监督机器学习模型的性能和可解释性多目标优化

本研究提出了一种不受模型约束的框架，可以同时优化监督式机器学习模型在表格数据上的预测性能和可解释性，其中可解释性通过特征稀疏性、特征交互稀疏性以及非单调特征效应的稀疏性进行量化。

Jul, 2023

利用替代特征选择找到最佳的多样特征集

特征选择是一种流行的方法，可以获得小型、可解释且高度准确的预测模型。本文介绍了一种名为 “替代特征选择” 的方法，并将其形式化为一个优化问题。我们定义了替代特征集合的约束条件，并允许用户控制替代特征的数量和差异性。进一步分析了该优化问题的复杂性并证明了其 NP-hardness。最后，我们使用 30 个分类数据集评估了替代特征选择的效果，并观察到替代特征集合可能具有较高的预测质量，并分析了影响这一结果的几个因素。

Jul, 2023

无模型特征选择以促进表格数据中发现不同子组

该论文提出了一个面向数据的 AI 框架，可以自动选择重要特征，实现自动发现不同的数据子组并提高检测性能。通过在 MIMIC-III 和 Allstate Claims 公开数据集上的验证，该框架比现有的六种特征选择方法减少了 81 倍和 104 倍的特征选择时间，并实现了有竞争力的检测性能。

Mar, 2022

DOSA-MO: 多目标问题中系统性过高估计调整的双阶段优化器改进生物标志物发现

DOSA-MO 是一种新型的多目标优化封装算法，它通过学习原始估计、其方差以及解集大小如何预测过度估计，并调整期望值以在优化期间改进解集的组成，验证表明 DOSA-MO 基于三个转录组数据集对肾癌和乳腺癌进行生物标志物识别改进了基于遗传算法的最新研究在预测癌症亚型和 / 或患者总存活率时的性能。

Dec, 2023