在潜在混淆因素和选择偏差可能存在的情况下进行迭代因果分析
本文介绍了一种称为循环因果推断(CCI)的算法,能够在条件独立神经元操作符下对循环因果过程进行有效推断,如将循环因果过程表示为非递归线性结构方程模型与独立误差。实证结果表明,CCI 在循环情况下优于 CCD,且在无环情况下与 FCI 和 RFCI 竞争力不相上下。
May, 2018
研究了有向无环图中随意多个潜在变量和选择变量条件下因果信息的学习问题,在此设置中,提出了一种能够在计算上比 FCI 算法快得多的新算法 RFCI,虽然 RFCI 的输出在某些情况下比 FCI 输出略微不太具有信息性,但在渐近极限下 RFCI 的任何因果信息都是正确的,研究了一类图形,输出 FCI 和 RFCI 是相同的,并证明了 FCI 和 RFCI 在稀疏高维情况下的一致性。
Apr, 2011
使用有向无环图来建模系统的因果结构。在多个数据源(群体或环境)的数据聚合中,全局混淆模糊了许多因果发现算法中的条件独立性属性。因此,现有的因果发现算法不适用于多源设置。我们证明,如果混淆的基数有限(即数据来自有限数量的源),仍然可以实现因果发现。该问题的可行性取决于全局混淆因素的基数、观测变量的基数和因果结构的稀疏程度的权衡。
Nov, 2023
本研究旨在通过多项式数量的条件独立性测试来学习隐藏因果图的较粗糙表示,名为因果一致分区图(CCPG),它由顶点的一个分区和在其组件上定义的有向图组成,并满足方向性的一致性和其他有利于更细的分区的约束条件。此方法在因果图可识别的特殊情况下,通过多项式数量的测试,提供了首个有效的还原真实因果图的算法。
Jun, 2024
CICheck 是一种运行时验证工具,旨在通过可靠性和隐私角度对因果关系发现算法进行加固。CICheck 采用一种声音且可判定的编码方案,将条件独立性关系问题转化为 SMT 问题,并通过四阶段决策过程和三个轻量级优化措施高效解决问题。CICheck 包含两个变体:ED-CICheck 和 ED-CICheck,分别用于检测错误的条件独立性测试(以提高可靠性)和修剪过多的条件独立性测试(以提高隐私性)。
Sep, 2023
本文提出了一种称作混淆分离因果发现算法(Confounding Disentanglement Causal Discovery,简称 biCD)的方法,通过使用因果强度变分模型,将潜在变量作为中介变量来解决存在潜在变量的非确定数据情形下的因果关系发现问题。我们将结果用合成和实际数据进行了验证,证明了该方法的有效性。
May, 2023
本文介绍了一种从数据中学习因果图的因果发现方法,通过引入可移除变量的概念和递归方法来解决因果发现中的挑战,并提供了一个高效实现这些方法的 Python 包,可供实践者和研究人员在实际场景中使用。
Mar, 2024
在这篇论文中,我们介绍了一种新颖且多用途的因果发现框架,它几乎可以适用于因果网络中几乎任何地方存在的具有因果关系的隐藏变量(例如,它们可以是观测变量的效应)。通过研究秩与条件独立性的有效性,我们在理论上建立了某些潜在结构模式可辨识性的必要和充分条件。此外,我们开发了一种基于秩的潜在因果发现算法(RLCD),可以高效地定位隐藏变量,并确定它们的基数,发现包括测量和隐藏变量在内的整个因果结构。我们还证明,在某些图形条件下,RLCD 能够渐近地正确识别整个潜在因果图的马尔可夫等价类。在合成和真实的个性数据集上的实验结果证明了该方法在有限样本情况下的有效性。
Dec, 2023
提出了一种新的面向任意因果模型和异构数据的联邦因果探索方法,通过使用代理变量来解决不同客户端之间的数据异构性,并利用联邦条件独立性检验和联邦独立性改变原则来确定因果方向,无需对特定函数形式进行任何假设,以以保护数据隐私的方式构建摘要统计量,实验证明了该方法的有效性。
Feb, 2024