对属性选择中多元对称不确定性的样本代表性

Mar, 2024

对属性选择中多元对称不确定性的样本代表性

Representatividad Muestral en la Incertidumbre Simétrica Multivariada para la Selección de Atributos

Gustavo Sosa-Cabrera

TL;DR通过统计模拟技术分析了多变量对称不确定性（MSU）测量的行为，观察了属性数目、基数和样本大小对 MSU 的影响，并提出了一种在这三个因素不同组合情况下保持 MSU 良好质量的启发式条件，为推动维度缩减过程提供了有用的标准。

Abstract

In this work, we analyze the behavior of the multivariate symmetric uncertainty (MSU) measure through the use of statistical simulation techniques under various mixes of informative and non-informative randomly generated features. Experiments show how the number of attributes, their

multivariate symmetric uncertainty statistical simulation techniques informative and non-informative features dimension reduction cardinalities

发现论文，激发创造

多对称集合：通过对称性的对立提高多样性和泛化能力

本研究提出了一种名为 Multi-Symmetry Ensembles (MSE) 的框架，通过捕获对称轴上假设的多样性来构建多样化的集合，探索超越随机变化的模型权重和超参数假设空间并有效提高了分类性能、不确定性量化和迁移任务的泛化。

Mar, 2023

改进的矩阵不确定性选择器

本文在考虑存在观测误差的回归模型中，对于样本大小 n 远小于维度 p 且参数 θ* 是稀疏的情况，针对常见的 Lasso 和 Dantzig 选择器不稳定的问题进行了修正，提出了一种修正后的矩阵不确定性选择器，在 N 为随机矩阵的情况下其估计具有更好的精度。

Dec, 2011

互信息度量下针对无参数和健壮特征选择的重新采样方法

本研究提出了一种将互信息准则与前向特征选择策略相结合的方法，在平衡所选特征子集的最优性和计算时间方面具有很好的折衷。同时，为了解决互信息估计器的参数设置和决定何时停止前向过程等问题，使用了重采样方法、K 交叉验证和置换检验。这一程序在合成数据集和实际案例中进行了演示。

Sep, 2007

通过主体解混的方法实现多模态人类意图理解的细节解偏

通过引入一种叙述性因果图和分析主体的混淆效应的方法，我们提出了 SuCI，这是一个简单而有效的因果干预模块，可以消除主体作为未观察到的混淆因素的影响，并通过真实的因果效应对模型进行训练。全面的实验结果清楚地证明了该模块的有效性。

Mar, 2024

光谱非线性建模中相关变量选择的互信息

本文通过对原始数据进行变量选择，提出一种基于互信息度量的方法，通过选择出与模型输出存在信息联系的重要变量，以达到同时降低模型复杂度、提高模型泛化能力、增强模型解释性的目的。

Sep, 2007

多敏感属性的顺序公平机制

通过多次敏感特征逐步实现公平性，利用多元 Wasserstein 几何中心将 Strong Demographic Parity 的标准推广到具有多个敏感特征的情况，并提供一种闭式解决方案，使得对不同敏感特征之间的相关性有明确的解释，进而实现了风险和不公平性之间的权衡。该方法适用于近似公平性，提供了对特定敏感特征的公平性改进的有针对性优先级，从而实现了针对案例的适应性，通过数据驱动的解决方案估计程序，并在合成和真实数据集上进行了全面的数值实验证明了我们的后处理方法在促进公平决策方面的实际有效性。

Sep, 2023

基于互信息的特征选择方法综述

本文介绍了信息论特征选择方法的现状，阐明了特征相关性、冗余性和补充性（协同作用）的概念，以及马尔科夫毯子。定义了最优特征选择的问题。我们描述了一个统一的理论框架，它可以使成功的启发式标准符合相应方法所做的近似。还介绍了该领域中的一些未解决问题。

Sep, 2015

通过提高唯一相关性来提升基于互信息的特征选择

本文提出了一种通过增加独特关联系统来改善高维数据集下特征选择的方法，并提出了两个方案来评估独特关联性。实验结果表明，提出的方法可以在减少特征数量的同时提高分类性能，其对分类器性能的依赖性相对较低。

Dec, 2022

一种基于增量互信息和蟑螂群优化的特征选择算法

本研究提出了一种基于增量互信息的改进群智能优化方法（IMIICSO），它利用粗糙集理论计算基于互信息的特征选择重要性，通过探索超样本的互信息计算，可以丢弃无用的特征，有效降低最优特征子集的基数，提高了高维大规模数据集的特征筛选的效率和精度。

Feb, 2023

通用依存分析

提出了一种基于累积熵的多元相关性度量方法，称为 UDS，可用于测量任何维度的子空间的相关性，能够有效地捕捉线性和非线性相关性，且性能优于现有的相关性测量方法。

Oct, 2015