基于稀疏 Fisher-EM 算法的聚类判别变量选择
本研究提出了一种基于几何感知相互信息的判别式聚类模型 ——Sparse GEMINI,该算法通过简单的 L1 惩罚避免了组合特征子集探索的负担,同时只设计一个聚类模型,易于扩展到高维数据和大量样本进行。研究结果表明 Sparse GEMINI 是一种有竞争力的算法,在不使用相关性标准或先验假设的情况下,具有选择与聚类相关的变量子集的能力。
Feb, 2023
本文介绍了一种判别潜在混合模型(DLM)和一种估计算法 Fisher-EM 算法,可用于高维数据空间中的聚类,其结果优于现有的聚类方法,可以用于质谱数据聚类
Jan, 2011
本文提出了一种高效的算法,以一种高效、紧凑的方式从候选项中发现输入特征或分类器的稀疏表示,用于大规模识别,并在训练速度和性能方面显着优于传统方法和强大的分类器,特别是在有限的训练数据的情况下。
Nov, 2014
本文简要介绍了高维统计推断中变量选择的理论、方法和实现的最近发展,强调单峰罚函数的统计性质及其在高维统计建模中的作用,同时还回顾了独立筛选和两种方法在超高维变量选择方面的最近进展。
Oct, 2009
本文研究高维贝叶斯线性回归的计算复杂度,介绍了一种截尾稀疏先验变量选择方法,通过 Metropolis-Hastings 算法,保证了变量选择的一致性和快速混合。
May, 2015
研究的主要目标是解决高维非线性变量选择的问题,提出了一种基于多核学习框架和有向无环图的核函数选择方法,能够以多项式时间选择核函数,具有高预测性能。
Sep, 2009
该论文提出了一种基于无监督学习的特征选择方法,将最大间隔准则和基于稀疏性的模型整合到一个联合框架中,将类间间距和特征相关性同时考虑,通过将 Kmeans 嵌入框架中来生成伪类标签,从提取特征系数矩阵的稀疏结构来有效去除噪声和无关特征,并提出了一种收敛保证的算法以迭代地寻找最优解,对六个基准数据集进行了广泛的性能评估,实验结果表明,该方法的性能优于所有其他对比方法。
Jun, 2015
提出一种基于贝叶斯方法、将先验分布放置在回归系数以及模型空间上、使用针对高维协变量的针尖和板块高斯先验、通过 Gibbs 抽样执行的变量选择方法,具有可靠的选择一致性和优于其他方法的良好性能。
May, 2014
提出了一种基于依赖网络和图中心性度量实现变量重要性评估的新数据分析方法,该方法无需考虑底层学习任务类型,通过选择排名前 n 位的图中心性量度高的变量来构建备选变量集合,可为进一步的学习任务提供强有力的变量子集。同时,利用 Shiny app 开发了一个用户友好的工具,方便选择和比较变量子集。
Apr, 2023
稀疏主成分分析通过将高维数据映射到低维线性子空间,通过设置加载向量为稀疏,实现降维和变量选择;然而,为了避免选择无关变量,本研究提出了使用假阳性发现率控制负载向量支撑的稀疏主成分分析算法,并结合 “终止随机实验” 选择器来自动确定支撑集合;实验结果表明这种方法显著提高了性能。
Jan, 2024