Jan, 2024

基于鲁棒加权评分的特征选择方法用于高维二元类不平衡基因表达数据

TL;DR该研究提出了一种适用于高维基因表达二分类的不平衡数据的鲁棒加权评分方法(ROWSU),通过解决基因表达数据集中高度倾斜的类分布问题,从而提高分类算法的性能。该方法通过平衡训练数据集、贪心搜索选择最小基因子集、引入支持向量计算权重的新型鲁棒评分方法,确保选择出最具辨识性的基因,并在最后与贪心搜索选择的基因子集组合以形成最终基因子集。实验证明,该方法在三种分类性能评估指标下优于现有的基于 k 最近邻(kNN)和随机森林(RF)分类器的特征选择算法。