- CONCERT: 带条件棱镜稀疏先验的协变量丰富的鲁棒局部信息传输
我们提出了一种新颖的贝叶斯迁移学习方法 CONCERT,可以用于高维数据分析,通过引入条件 spike-and-slab 先验来进行信息传输,而且具有变量选择一致性和传输效率的优势。
- 惩罚式生成变量选择
利用条件瓦狄斯坦生成对抗网络进行建模和估计,应用组 Lasso 惩罚实现变量选择,分析受截尾生存数据的收敛率、近似误差和效率,以及通过仿真和实验数据分析实际应用中的实用性。
- kNN 算法在条件均值和方差估计中的自动不确定性量化和变量选择
本研究介绍了一种基于 kNN 的回归方法,它结合了传统非参数 kNN 模型的可扩展性和适应性以及新颖的变量选择技术,主要关注准确估计随机响应变量的条件均值和方差,从而有效地刻画不同场景下的条件分布特征。我们的方法结合了条件均值和方差的先验估 - FDR 受控稀疏金融指数跟踪的投资组合优化
在高维数据分析中,如金融指数跟踪或生物医学应用中,关键是选择少数相关变量,同时控制错误发现率。针对这些应用中变量之间常常存在强烈的相关性(例如股票回报),而现有方法(如模型 - X knockoff 方法或 T-Rex 选择器)的 FDR - 具有伪发现率控制变量选择的稀疏主成分分析
稀疏主成分分析通过将高维数据映射到低维线性子空间,通过设置加载向量为稀疏,实现降维和变量选择;然而,为了避免选择无关变量,本研究提出了使用假阳性发现率控制负载向量支撑的稀疏主成分分析算法,并结合 “终止随机实验” 选择器来自动确定支撑集合; - 使用深度神经网络的多变量回归模型的最小距离估计器
我们提出了一种基于深度神经网络的最小距离估计器 (DNN-LD),用于解决多元回归问题,并考虑高维数据中的变量选择问题,通过在 DNN 结构的权重参数上应用 (自适应) 分组 Lasso 惩罚,同时实现变量选择和模型估计。
- 加权支持向量机的稀疏学习和类概率估计
我们提出了一种基于加权支持向量机的稀疏学习方法,结合了自动变量选择和准确的概率估计,既能有效地进行变量选择,又能可靠地估计概率。这种方法在自动变量选择和可靠概率估计方面具有巨大优势,并且适用于高维问题。
- 可解释分布比较中的最大均值差异的变量选择
这篇研究论文研究了在两样本检验中的变量选择问题,基于最大平均差异(MMD)的两样本检验的能力,通过优化自适应相关检测(ARD)权重来确定引起两个分布差异的变量,提出了考虑稀疏正则化的两种方法以解决选择适当正则化参数的问题,并通过与基线方法的 - 条件预测函数:用于复杂模型误报控制的新技术
现代科学研究中,识别与结果相关的变量是一个常见目标。本研究介绍了一种基于条件预测函数 (CPF) 的变量选择方法,该方法能够捕捉预测变量与结果之间的非线性关系,并同时考虑特征之间的相关性,具有优于常见方法的选择功效。
- 随机森林中超参数对变量选择的影响
随机森林 (RF) 在高维物质研究中的预测建模和变量选择方面具有很好的适用性。超参数在 RF 算法对预测性能和变量重要性估计的影响已被研究,然而,超参数对基于 RF 的变量选择的影响尚不清楚。本文使用理论分布和实验基因表达数据进行两个模拟研 - 基于区域标准的 COBRA 方法在条件生存预测中的应用
本文探讨了一种不同的组合回归策略,用于计算条件生存函数。我们使用基于回归的弱学习器创建了提出的集成技术。提出的组合回归策略使用接近度测量作为两个生存曲线之间的区域。提出的模型表明,它比随机生存森林更好。该论文讨论了一种在组合回归设置中选择最 - 广义线性模型中的最佳子集选择:一种基于剪接技术的快速且一致的算法
在高维广义线性模型中,通过使用快速算法选择最佳子集,以高确定性解决了多变量选择的问题并证明了统计性质。
- 一个高效的纳什均衡值计算方法用于朴素贝叶斯分类器
本文提出了 Shapley 值在朴素贝叶斯分类器中的确切分析表达式,并对其与证据权重和 KernelShap 在实际数据集上的结果进行了比较,结果表明我们的 Shapley 方案在算法复杂度低的情况下提供了具有信息量的结果,可以在大规模数据 - 运用图指针网络在组合优化中的学习分支
本文提出了一种聚合图神经网络和指针机制的图指针网络模型来学习分支定界中的变量选择策略,结果表明该模型在求解速度和搜索树大小方面都优于现有的机器学习和专家设计的分支规则。
- 通过 LASSO 正则化证明双层 ReLU 神经网络的可识别性
本文将 LASSO 正则化技术推广到两层 ReLU 神经网络中,通过扩展限制等距性原理分析框架,可实现稳定重构神经网络并识别输入的子集,从而提出了一种基于神经网络的变量选取方法。实验结果表明与现有技术相比,该方法具有良好表现。
- 大数据学习的缓慢杀死
本文介绍了一种称为 “slow kill” 的新技术,它利用了非凸约束优化、自适应规则化和动态学习率的方法来解决大规模变量筛选的问题,并且实验证明了其优越性。
- 采用 Copula 熵的系统辨识
本文介绍了一种基于 Copula Entropy 的新的变量选择方法,应用于识别动态系统的微分方程。该方法具有非参数和无超参数的特点。通过模拟实验,证明了该方法的有效性。
- DiscoVars:一种新的数据分析视角 —— 应用于聚类变量选择
提出了一种基于依赖网络和图中心性度量实现变量重要性评估的新数据分析方法,该方法无需考虑底层学习任务类型,通过选择排名前 n 位的图中心性量度高的变量来构建备选变量集合,可为进一步的学习任务提供强有力的变量子集。同时,利用 Shiny app - AAAI稀疏变量独立性稳定学习
本研究提出了一种包含稀疏变量独立和样本加权选择的迭代算法 SVI 来解决协变量偏移泛化问题,在合成和实际数据集上的实验表明 SVI 可提高协变量偏移广义性能。
- 基于 Monte Carlo Tree Search 的高维贝叶斯优化变量选择
本文介绍了一种基于 Monte Carlo Tree Search 的变量选择方法 MCTS-VS,通过迭代选择和优化一组变量来构建低维空间,并使用任何 Bayesian optimization 算法在该空间内进行优化,经过高维合成函数和