利用有向因果发现技术检测潜在共因变量
通过逻辑推理的方法,基于简单的关系逻辑陈述从部分观测到的关系推出因果关系的方法,可以在存在潜在变量和选择偏差的情况下找到对应局部祖先图的所有不变特征,发现每一个可识别的因果关系都对应了两种基本形式,因为该方法的基本构建块不依赖于图形结构,因此可以开发更稳健的推理,详细的询问方法和大规模应用方案。
Feb, 2012
本文提出了一种非常通用的方法来学习因果模型的结构,该方法基于从任何给定的重叠的被动观察或实验性数据集获得的d-分离约束。此方法允许直接循环(反馈回路)和潜在变量的存在。我们的方法基于因果路径的逻辑表示,允许将相当通用的背景知识集成,推理是使用布尔满足(SAT)求解器执行的。该过程是完整的,因为它用尽了关于是否可以确定存在或不存在任何给定边缘的可用信息,否则返回“未知”。许多现有的基于约束的因果发现算法可以看作是特殊情况,适用于一个或多个限制性假设的情况。模拟说明了这些假设对发现的影响以及现有算法的扩展能力。
Sep, 2013
本文提出了一种称作混淆分离因果发现算法(Confounding Disentanglement Causal Discovery,简称biCD)的方法,通过使用因果强度变分模型,将潜在变量作为中介变量来解决存在潜在变量的非确定数据情形下的因果关系发现问题。我们将结果用合成和实际数据进行了验证,证明了该方法的有效性。
May, 2023
本文介绍了一种在存在连续变量的情况下发现因果关系的方法,通过解决离散数据的严格级别约束限制的问题,把连续因果关系测试转换为每个区间内离散因果关系的测试, 这些非参数规则可以广泛适用于大量结构因果模型。
May, 2023
寻找自动化搜索方法,从观察数据中学习因果结构;讨论潜变量和观察变量之间的因果联系以及它们之间的潜在模式和结构;提出了不同于高斯分布条件的k-三角性忠诚度的另一定义,可用于非高斯分布;轻松学习具有潜变量的因果结构的充分性假设。
Aug, 2023
使用有向无环图来建模系统的因果结构。在多个数据源(群体或环境)的数据聚合中,全局混淆模糊了许多因果发现算法中的条件独立性属性。因此,现有的因果发现算法不适用于多源设置。我们证明,如果混淆的基数有限(即数据来自有限数量的源),仍然可以实现因果发现。该问题的可行性取决于全局混淆因素的基数、观测变量的基数和因果结构的稀疏程度的权衡。
Nov, 2023
在这篇论文中,我们介绍了一种新颖且多用途的因果发现框架,它几乎可以适用于因果网络中几乎任何地方存在的具有因果关系的隐藏变量(例如,它们可以是观测变量的效应)。通过研究秩与条件独立性的有效性,我们在理论上建立了某些潜在结构模式可辨识性的必要和充分条件。此外,我们开发了一种基于秩的潜在因果发现算法(RLCD),可以高效地定位隐藏变量,并确定它们的基数,发现包括测量和隐藏变量在内的整个因果结构。我们还证明,在某些图形条件下,RLCD能够渐近地正确识别整个潜在因果图的马尔可夫等价类。在合成和真实的个性数据集上的实验结果证明了该方法在有限样本情况下的有效性。
Dec, 2023
本研究通过审查现有文献并进行实证评估,在理解各领域现象根本原因的认识中,针对因果发现算法的碎片化、方法不一致以及缺乏全面评估等问题进行了全面而系统的研究,以提供对该领域的更清晰、更结构化的认识。研究中包括了对纳入10多年的、现有综述未能涵盖的因果发现进展的全面文献回顾,对200多篇学术文章的详细分析,鉴别出24个不同的算法,并以复杂性为导向,将这些方法划分为6个主要类型的分类法。研究还对20多个因果发现算法在合成和真实数据集上进行了扩展的实证评估,将合成数据集根据规模、线性度和噪声分布进行分类,运用了5个评估指标,并对不同数据场景的前3个算法推荐进行了总结,这些推荐已在2个真实数据集上得到验证。我们的研究结果突出了数据集特征对算法性能的重要影响。此外,我们还开发了一种元数据提取策略,用于帮助用户在未知数据集上选择算法。元数据估计的准确度超过80%。基于这些发现,我们提供了专业而实用的建议,以帮助用户选择最适合其特定数据集需求的因果发现方法。
Jul, 2024