- 利用图数据结构和知识图谱的特征选择策略综述
知识图谱中的特征选择方法论及其在增强机器学习模型有效性、假设生成和解释性方面的作用,强调可扩展性、准确性和可解释性的关键重要性,并倡导结合领域知识来优化选择过程。强调多目标优化和跨学科合作在推进知识图谱特征选择方面的潜力,以及这些方法对精准 - 具有 $k$- 次模函数的 Stackelberg 博弈下的分配风险感知性和鲁棒性
我们研究了在对抗环境中的子模规划优化问题,该问题适用于机器学习中使用容易受到不确定性和攻击的数据进行特征选择。我们关注攻击者和防御者之间的斯塔克尔伯格博弈,攻击者的目标是最小化防御者最大化的 k - 子模规函数。我们考虑攻击成功和数据噪声带 - 网络入侵检测中注重检测率的多目标进化特征选择
本研究提出了 DR-MOFS,将网络入侵检测中的特征选择问题建模为一个三目标优化问题,通过使用多目标进化算法同时优化特征数量、准确率和检测率,实验结果表明,该方法在大多数情况下优于以前的方法,即减少特征数量,提高准确率和检测率。
- 关于特征选择中核依赖最大化的限制性研究
通过反例,我们证明了使用 Hilbert-Schmidt 独立性准则(HSIC)来进行特征选择的基本原理是错误的,而且通过 HSIC 的最大化可能会忽略掉关键特征。
- 揭示隐藏因素:可解释的 AI 用于提升语音情感识别中的特征
本研究提出了一种迭代特征增强方法来增强语音情感识别(SER)中机器学习模型的性能,并通过模型解释性实现了对情感决策的重要特征的识别和删除,对 SER 数据集的实验证明了该方法的有效性。
- 决策树算法的超快速选择
我们提出了一种名为 Superfast Selection 的新颖系统方法,用于在表格数据上选择决策树和特征选择算法的 “最优分裂”。该方法通过降低时间复杂度(从 O(MN)降至 O(M))来加快在单个特征上的分裂选择,M 表示输入示例的数 - 探索长期船舶事故风险预测的关键因素
通过因子分析预测海事安全事故风险,筛选关键因素并提供管理策略。
- 共形递归特征消除
提出了基于置信度预测的递归特征消除方法,命名为 CRFE,该方法在多类别数据集上通过多次数据分区的比较,表现出优于传统 RFE 方法的性能,并提供有效和非冗余特征的子集而无需计算任何分类性能。
- GIST:贪婪独立集合阈值用于多样数据摘要
我们提出了一种新颖的子集选择任务,称为最小距离多样化数据汇总(MDDS),它在机器学习中有广泛的应用,例如数据采样和特征选择。我们介绍了 GIST 算法,它通过将一系列最大独立集问题近似为双准则贪婪算法来实现 MDDS 的 2/3 近似保证 - 数据解释性和特征选择的部分信息分解
本文介绍了 Partial Information Decomposition of Features(PIDF),一种同时实现数据可解释性和特征选择的新范式。相较于传统方法,我们的方法基于每个特征的三个度量值:与目标变量的相互信息、特征对 - 超越噪音:最佳邻域识别下的内在维数估计
在这项工作中,我们介绍了一种自动选择合适尺度的协议,该尺度能够使内在维度具有意义且有用,并且通过对人工和真实数据集的基准测试来证明了该程序的实用性和鲁棒性。
- 使用机器学习模型进行电影收入预测
用机器学习模型预测电影收益,通过收集、预处理、分析、选择模型、评估和改进的结构化方法,构建了一个准确预测电影收益的模型,使用线性回归、决策树、随机森林回归、Bagging、XGBoosting 和 Gradient Boosting 进行训 - MTLComb:多任务学习结合回归和分类任务的联合特征选择
多任务学习是一种学习范式,可以同时训练多个相互通信的算法。本研究提出了一种可证明的损失加权方案,用于平衡回归和分类任务,并通过建立 MTLComb 算法和软件包来展示其有效性。
- 利用机器学习解码认知健康:针对显著记忆问题的全面评估诊断
在这个研究中,通过对随机神经网络(RNNs)和基于超平面的分类器(HbCs)家族的机器学习模型进行全面评估,以探究 SMC 诊断方法。该研究利用 ADNI2 数据集中的 SMC 患者和健康老年人的磁共振成像扫描,从灰质、白质、Jacobia - 非负矩阵分解在降维中的应用:一项综述
本文综述了非负矩阵分解(NMF)在降维中的应用,重点关注其在特征提取和特征选择方面。我们分类了降维方法,对 NMF 的不同方法进行了全面总结。此外,我们讨论了 NMF 在降维中的最新研究趋势和潜在未来发展方向,旨在突出需要进一步探索和发展的 - 大规模 RNA 数据的特征选择多域多任务方法
提出了一种用于特征选择的多领域多任务算法,通过研究小鼠对沙门氏菌感染的宿主免疫反应产生的两个数据集,收集了来自多种协作交叉小鼠品系的数据,样本来自脾脏和肝脏,进行了多个机器学习实验并分别提取了在不同案例中具有区分度的少量跨领域特征子集,证明 - CBMAP:基于聚类的流形逼近和投影用于降维
介绍了一种基于聚类的降维方法 CBMAP,旨在同时保留全局和局部结构,提供速度、可扩展性和对超参数依赖较小的解决方案,满足机器学习应用中对测试数据的低维投影的需求。
- 用于可解释无监督树集合的特征图:中心性、交互性及在疾病亚型划分中的应用
在医疗保健等高风险领域中,可以理解模型预测原理同实现高预测准确性一样重要的可解释机器学习已成为利用人工智能的核心。本研究引入了从非监督随机森林构建特征图的新方法和通过这些图派生有效特征组合的特征选择策略,通过在整个数据集和个别聚类上构造特征 - 基于神经符号嵌入的自回归生成短且高效特征选取
本研究通过神经符号化的视角提出了一个新颖的生成框架,旨在通过学习有效特征子集来改进下游模型的性能,并且提出了一个基于编码器 - 解码器 - 评估器学习范式,在连续嵌入空间中保留特征选择的智能进行高效搜索。综合实验证实了该框架的有效性。
- 生存分析的可解释预测与特征选择
DyS 是一种新的生存分析模型,它在生存分析问题上表现出色,尤其适用于大规模的观察型医疗研究数据集,具备强大的判别能力和可解释性。