本文提出一个解释黑盒视觉分类器的因果推断扩展,即在实例特征选取的基础上选择对模型输出具有最大因果效应的特征子集,并使用相对熵距离量化这些特征子集的因果影响,该方法运用于多个视觉数据集中并证明了其高效性。
Apr, 2021
本文介绍了一种使用因果干预公平性范例,通过在数据管理的集成组件中考虑公平性来识别特征以提高预测质量而不添加偏差的方法,提出了一种使用条件独立性检测的方法来确定确保干预公平的特征子集,并通过现实世界的数据集进行了详细的实证评估,证明了方法的有效性和效率。
Jun, 2020
在分散设置中,本文研究了因果多标签特征选择的挑战性问题,并提出了一个包含三个新颖子程序的分散因果多标签特征选择 (FedCMFS) 算法,能够在不集中数据的情况下保持数据隐私,实现对相关特征的选择和移除,为分散设置中的因果多标签特征选择提供了一种有效的方法。
Mar, 2024
DRCFS 是一种具有理论保证的双重稳健特征选择方法,可用于确定复杂系统中与目标变量高度相关的因果特征,特别是针对非线性和高维问题。
Jun, 2023
该篇论文提出了蕴含系统因果结构的信息论量,用于评估给定的目标变量的因果重要性,并展示了因果信息增益在特征选择中的优越性,从而为涉及因果关系的领域的可解释性方法的发展铺平了道路。
Sep, 2023
本文介绍了信息论特征选择方法的现状,阐明了特征相关性、冗余性和补充性(协同作用)的概念,以及马尔科夫毯子。定义了最优特征选择的问题。我们描述了一个统一的理论框架,它可以使成功的启发式标准符合相应方法所做的近似。还介绍了该领域中的一些未解决问题。
Sep, 2015
我们提出了一种新颖的方法,结合了特征选择和因果发现,专注于时间序列,通过使用前向和后向特征选择程序,并利用传递熵来估计从特征到目标的因果信息流,实现了特征的选择不仅仅基于模型性能,还捕捉到因果信息流。
Oct, 2023
对比分析(CA)是指与相应背景数据集相比,在目标数据集中独特丰富的变化的探索,这些变化源自与给定任务无关的变异源。本文介绍了对比特征选择(CFS),一种在对比分析环境中进行特征选择的方法,通过一种新的信息论分析方法,我们证明了我们的方法在对比分析环境中的表征学习,并且我们经验证实验证明了 CFS 方法在半合成数据集和四个真实生物医学数据集上一致优于以前提出的不针对对比分析环境的先进监督和完全无监督的特征选择方法。我们的方法的开源实现可在此 https URL 找到。
通过选择最具信息量的特征并消除无关的特征,我们提出了一种新的基于差异性特征的滤波特征选择方法 ContrastFS,该方法能够在大型数据集上有效地降低计算成本,而且性能优于其他最先进的特征选择方法。
Jan, 2024
提出了一种名为 FairSFS 的新型算法,用于公平流式特征选择,以在不妨碍在线数据处理能力的前提下,解决当前流式特征选择算法在管理偏见和避免歧视方面的不足,避免了敏感属性相关数据的传播,并体现了不输于领先的流式特征选择方法和现有公平特征技术的准确性和公平度的显著提高。
Jun, 2024