本文采用混合整数圆锥优化方法,结合整体广义线性模型,完全自动化模型选择过程。具体而言,我们直接优化赤池信息准则和贝叶斯信息准则,并在特征选择任务中引入旨在处理多重共线性的约束条件,其中包括一种新的配对相关约束,它结合了符号协调约束和来自经典统计模型(如岭回归模型和 OSCAR 模型)的想法。
Apr, 2024
本文提出了一类非凸惩罚剖面似然方法,用于选择和估计线性混合效应模型中的重要固定效应和随机效应,并针对随机效应的未知协方差矩阵使用代理矩阵,进一步提出了一种组变量选择策略,以同时选择和估计重要的随机效应。
Nov, 2012
本文综述了模型选择领域的各种方法,包括统计,信息论和信号处理等方面的研究。讨论了模型选择的意义、表现和适用性,并提供了一些关于实践中的争议观点。
Oct, 2018
提出了一种用于模型选择的半贝叶斯原则,并通过渐近扩展导出了半贝叶斯信息准则(SIC),该方法在模型正确性和不正确性下的模型选择具有优势。
May, 2010
本文提出了一种因子方法来同时考虑模型选择和功能回归的视角,通过将预测向量分解为反映解释变量的共同因素和特定变异性的两个不相关随机分量,以包括主成分作为额外的解释变量在增广回归模型中,维度高于样本大小的线性回归问题中传统假设的稀疏向量参数是具有限制性的,模型选择程序可以用于估计增广模型的参数,并得出其理论性质和有限样本表现。
Feb, 2012
利用稀疏非线性动力学算法和信息准则对动力学系统进行模型选择,自动且有原则地选择得到强支持的模型,这个方法能够准确地鉴别出多个基本动力学系统,包括一个 SEIR 疾病模型和 Lorenz 方程。
Jan, 2017
该研究论文提出了两种自动化模型选择方法,分别是基于优先级的随机网格搜索和贪婪搜索方法,应用于包含特征交互的表格数据集,有效捕获预测性特征组合。
Jan, 2024
考虑到基因组关联研究,在许多预测变量已经在同一个个体中收集并且每个预测变量都是单独分析的情况下,我们引入一个标准的线性模型,并在其中引入一个额外的随机效应。本文的三个创新点是(1)线性和 log-odds 尺度之间的转换是准确的,特别适用于小效应大小的重要的遗传情况;(2) 一种极大似然算法,比以前发表的方法快一个数量级以上;和 (3) 计算边缘似然的有效方法,允许贝叶斯模型比较。该方法已成功应用于包括超过 20,000 个人和 500,000 个遗传变异的多发性硬化的大规模关联研究。
Jul, 2012
该论文对比了几种在实际模型选择问题中广泛使用的贝叶斯模型选择方法,重点关注回归和分类的变量子集选择,并使用模拟和现实世界的数据进行了几次数值实验。结果表明,考虑到模型不确定性是预测效果最好的。此外,投影法明显优于交叉验证得分的基于选择的方法,并且交叉验证在指导模型大小选择和评估最终选择的模型的预测性能方面大有裨益。
Mar, 2015
本文为实现树形和图形模型的结构化选择,精心平衡误差和遗漏,开发了矫正版的 Mallows's Cp 准则。
Jun, 2023