支持向量机的成本敏感特征选择
我们提出了一种新颖的支持向量机模型,通过在问题表达中引入性能约束来考虑误分类成本。具体而言,我们的目标是寻求具有最大间隔的超平面,使得误分类率低于给定的阈值。通过解决一个具有线性约束和整数变量的二次凸问题来获得最大间隔超平面。我们的实验结果表明,我们的模型可以使用户在一个类别上对误分类率进行控制,并且运行时间可行。
Dec, 2023
通过选择最具信息量的特征并消除无关的特征,我们提出了一种新的基于差异性特征的滤波特征选择方法 ContrastFS,该方法能够在大型数据集上有效地降低计算成本,而且性能优于其他最先进的特征选择方法。
Jan, 2024
提出了从混合整数锥优化的角度,具有证明最优的特征选择程序的机器学习方法,可以考虑辅助成本以获取特征,同时创建了用于临床预后模型研究的合成数据生成器,以系统评估不同的启发式和最优基数约束特征选择程序。
Oct, 2023
本文综述了不同的特征选择方法及其与机器学习算法之间的关系,阐述了特征选择在数据挖掘过程中的重要性,特别是在处理数量过多的特征时,可以降低计算负担和提高机器学习任务的准确性。
Oct, 2015
给定线性支持向量机(SVM),提出了一种特征选择算法,以实现有监督或无监督的学习。算法能够在确定性和随机化的情况下运行,并且在特征空间中的误差得到保证,从而保证了与完整的特征空间相当的概括能力。在真实世界的数据集上的实验结果表明,该方法比之前的最佳方法更加高效。
Jun, 2014
特征选择是一种流行的方法,可以获得小型、可解释且高度准确的预测模型。本文介绍了一种名为 “替代特征选择” 的方法,并将其形式化为一个优化问题。我们定义了替代特征集合的约束条件,并允许用户控制替代特征的数量和差异性。进一步分析了该优化问题的复杂性并证明了其 NP-hardness。最后,我们使用 30 个分类数据集评估了替代特征选择的效果,并观察到替代特征集合可能具有较高的预测质量,并分析了影响这一结果的几个因素。
Jul, 2023
本研究提出了一种新颖的方法,量子支持向量机特征选择(QSVMF),将量子支持向量机与多目标遗传算法相结合。QSVMF 通过优化多个同时目标来实现:最大化分类准确性,最小化选定特征和量子电路成本,并减少特征协方差。我们将 QSVMF 应用于一个乳腺癌数据集进行特征选择,将 QSVMF 与传统方法在选定特征上的性能进行对比。实验结果表明,QSVMF 取得了卓越的性能。此外,QSVMF 的帕累托前缘解能够分析准确性与特征集大小的权衡,识别出极度稀疏但准确的特征子集。我们从已知的乳腺癌生物标志物的角度解释了所选特征的生物学相关性。本研究强调了量子特征选择在提高机器学习效率和性能方面的潜力,尤其是在处理复杂的真实世界数据时。
Nov, 2023