本文采用混合整数圆锥优化方法,结合整体广义线性模型,完全自动化模型选择过程。具体而言,我们直接优化赤池信息准则和贝叶斯信息准则,并在特征选择任务中引入旨在处理多重共线性的约束条件,其中包括一种新的配对相关约束,它结合了符号协调约束和来自经典统计模型(如岭回归模型和 OSCAR 模型)的想法。
Apr, 2024
本文提出了一种新的主动特征获取方法,使用 Lazy Model 和 Fisher scores 确定特征子集以在测试期间最大程度地提高预测性能同时最小化成本(即特征获取成本达到可接受的精度或预算限制),并在合成和实际数据集上进行了实验来证明其准确性和速度优势。
Jun, 2023
通过数学优化的特征选择过程嵌入到支持向量机分类过程中,结合了不对称的分类错误代价,旨在减少特征数量并保持误分类率的平衡。
Jan, 2024
本研究介绍了一种名为贪婪特征选择的用于分类任务的特征排序新方法,并通过理论和数值测试探究了该方法在模型容量指标以及预测活动太阳的地球有效表现问题上的好处。
Mar, 2024
为解决大规模特征选择问题,本文提出了一种新的二元多目标坐标搜索(MOCS)算法,该算法在真实世界的大规模数据集上展现出显著的优越性,并且比 NSGA-II 算法更快速、更高效地解决特征选择问题。
Feb, 2024
本文提出了一种数据驱动的、可推广的割平面方法 Cut Ranking,用于选择多实例学习中的切割。通过训练一个由特征决定的评分函数,该方法被证明比传统的启发式算法更为有效,可适用于具有不同特性的多种问题,且在实验和在线 A / B 测试中效果显著。
May, 2021
本文比较了不同算法在特征选择方面的效果,结果表明 PCA、Rough PCA、USQR 和 EDR 算法能够快速筛选出对数据分类最相关的特征。
Jun, 2013
特征选择是一种流行的方法,可以获得小型、可解释且高度准确的预测模型。本文介绍了一种名为 “替代特征选择” 的方法,并将其形式化为一个优化问题。我们定义了替代特征集合的约束条件,并允许用户控制替代特征的数量和差异性。进一步分析了该优化问题的复杂性并证明了其 NP-hardness。最后,我们使用 30 个分类数据集评估了替代特征选择的效果,并观察到替代特征集合可能具有较高的预测质量,并分析了影响这一结果的几个因素。
Jul, 2023
通过选择最具信息量的特征并消除无关的特征,我们提出了一种新的基于差异性特征的滤波特征选择方法 ContrastFS,该方法能够在大型数据集上有效地降低计算成本,而且性能优于其他最先进的特征选择方法。
本文介绍了一种基于 Least Absolute Shrinkage 和 Selection Operator(Lasso)的特征选择方法,通过使用核函数来捕捉非线性的输入输出关系,并采用基于核的独立度量来找到与输出值具有强统计依赖关系的非冗余特征。实验结果表明,该方法在具有数千个特征的场景下具有很好的效果。
Feb, 2012