对属性选择中多元对称不确定性的样本代表性
本研究提出了一种名为 Multi-Symmetry Ensembles (MSE) 的框架,通过捕获对称轴上假设的多样性来构建多样化的集合,探索超越随机变化的模型权重和超参数假设空间并有效提高了分类性能、不确定性量化和迁移任务的泛化。
Mar, 2023
本文在考虑存在观测误差的回归模型中,对于样本大小 n 远小于维度 p 且参数 θ* 是稀疏的情况,针对常见的 Lasso 和 Dantzig 选择器不稳定的问题进行了修正,提出了一种修正后的矩阵不确定性选择器,在 N 为随机矩阵的情况下其估计具有更好的精度。
Dec, 2011
本研究提出了一种将互信息准则与前向特征选择策略相结合的方法,在平衡所选特征子集的最优性和计算时间方面具有很好的折衷。同时,为了解决互信息估计器的参数设置和决定何时停止前向过程等问题,使用了重采样方法、K 交叉验证和置换检验。这一程序在合成数据集和实际案例中进行了演示。
Sep, 2007
通过引入一种叙述性因果图和分析主体的混淆效应的方法,我们提出了 SuCI,这是一个简单而有效的因果干预模块,可以消除主体作为未观察到的混淆因素的影响,并通过真实的因果效应对模型进行训练。全面的实验结果清楚地证明了该模块的有效性。
Mar, 2024
本文通过对原始数据进行变量选择,提出一种基于互信息度量的方法,通过选择出与模型输出存在信息联系的重要变量,以达到同时降低模型复杂度、提高模型泛化能力、增强模型解释性的目的。
Sep, 2007
通过多次敏感特征逐步实现公平性,利用多元 Wasserstein 几何中心将 Strong Demographic Parity 的标准推广到具有多个敏感特征的情况,并提供一种闭式解决方案,使得对不同敏感特征之间的相关性有明确的解释,进而实现了风险和不公平性之间的权衡。该方法适用于近似公平性,提供了对特定敏感特征的公平性改进的有针对性优先级,从而实现了针对案例的适应性,通过数据驱动的解决方案估计程序,并在合成和真实数据集上进行了全面的数值实验证明了我们的后处理方法在促进公平决策方面的实际有效性。
Sep, 2023
本文介绍了信息论特征选择方法的现状,阐明了特征相关性、冗余性和补充性(协同作用)的概念,以及马尔科夫毯子。定义了最优特征选择的问题。我们描述了一个统一的理论框架,它可以使成功的启发式标准符合相应方法所做的近似。还介绍了该领域中的一些未解决问题。
Sep, 2015
本文提出了一种通过增加独特关联系统来改善高维数据集下特征选择的方法,并提出了两个方案来评估独特关联性。实验结果表明,提出的方法可以在减少特征数量的同时提高分类性能,其对分类器性能的依赖性相对较低。
Dec, 2022
本研究提出了一种基于增量互信息的改进群智能优化方法(IMIICSO),它利用粗糙集理论计算基于互信息的特征选择重要性,通过探索超样本的互信息计算,可以丢弃无用的特征,有效降低最优特征子集的基数,提高了高维大规模数据集的特征筛选的效率和精度。
Feb, 2023