利用双变量因果发现集成重叠数据
本文介绍了第一种可进行大样本因果关系可靠识别的计算可行的基于分数的算法,允许存在未观测到的共同原因,并基于从观测数据中学习的贝叶斯网络结构来识别所谓的Y子结构,从而无需为存在未观察到的共同原因的因果结构分配分数。
Jun, 2012
本文回顾了两组单变量因果发现的方法:加性噪声方法(ANM)和信息几何因果推断(IGCI)。作者呈现了一项由各个领域(如,气象学、生物学、医学、工程、经济学等)37个数据集中选择的100个不同因果对的数据基准,这些方法在真实世界基准数据上的实证结果表明,某些方法确实能够仅使用纯观测数据区分原因和效应。
Dec, 2014
本文分析了没有条件独立(conditional independence)武器下,因果探索算法的样本复杂度,以及领域专业知识在数据样本方面的价值,并通过数字实例证明了这些抽样率的准确性,并量化了稀疏先验和已知因果方向的好处。
Feb, 2021
我们提出了一种迭代因果发现算法(ICD),可在潜在混淆变量和选择偏差的情况下恢复因果图,并演示了 ICD 相较于 FCI、FCI+和RFCI算法,需要更少的CI测试并学习更准确的因果图。
Nov, 2021
本文提出了一种称作混淆分离因果发现算法(Confounding Disentanglement Causal Discovery,简称biCD)的方法,通过使用因果强度变分模型,将潜在变量作为中介变量来解决存在潜在变量的非确定数据情形下的因果关系发现问题。我们将结果用合成和实际数据进行了验证,证明了该方法的有效性。
May, 2023
通过因果推断方法可以推断未被观察到的联合分布的性质,进一步定义了一种从已观察到的变量中引入因果模型来推断未观察到变量的统计性质的学习场景,并且通过推导因果模型的 VC 维,得出了预测的泛化界限。
May, 2023
使用有向无环图来建模系统的因果结构。在多个数据源(群体或环境)的数据聚合中,全局混淆模糊了许多因果发现算法中的条件独立性属性。因此,现有的因果发现算法不适用于多源设置。我们证明,如果混淆的基数有限(即数据来自有限数量的源),仍然可以实现因果发现。该问题的可行性取决于全局混淆因素的基数、观测变量的基数和因果结构的稀疏程度的权衡。
Nov, 2023
本研究旨在通过多项式数量的条件独立性测试来学习隐藏因果图的较粗糙表示,名为因果一致分区图(CCPG),它由顶点的一个分区和在其组件上定义的有向图组成,并满足方向性的一致性和其他有利于更细的分区的约束条件。此方法在因果图可识别的特殊情况下,通过多项式数量的测试,提供了首个有效的还原真实因果图的算法。
Jun, 2024
本研究解决了因果发现领域中基于监督学习方法可能导致的误导性结果问题,提出了一种无监督的二变量因果发现方法。通过使用稳健的互信息度量,考虑了不同变量类型的影响,提供了一组标准的无偏结果,以指导未来在完全未知环境下的因果发现任务。
Aug, 2024