基于独立性检验的测量误差和线性非高斯模型因果发现方法
本文分析了没有条件独立(conditional independence)武器下,因果探索算法的样本复杂度,以及领域专业知识在数据样本方面的价值,并通过数字实例证明了这些抽样率的准确性,并量化了稀疏先验和已知因果方向的好处。
Feb, 2021
我们提出了一种迭代因果发现算法(ICD),可在潜在混淆变量和选择偏差的情况下恢复因果图,并演示了 ICD 相较于 FCI、FCI+和RFCI算法,需要更少的CI测试并学习更准确的因果图。
Nov, 2021
探讨线性系统中存在测量误差时的因果推断问题,在鉴定列的置换和缩放范围内确定混合矩阵的情况下,发现这个问题与存在未观察到的无父原因的因果推断问题之间有相当惊人的联系,并提出了因果结构学习方法并在合成数据上评估了它们的性能。
Nov, 2022
本文研究因果关系发现方法,特别是用于非线性模型和高斯噪声假设的方法。提出了一种新的算法NoGAM,可以在最少的前提条件下发现因果关系,并在合成数据上进行了实验基准测试。
Apr, 2023
通过因果推断方法可以推断未被观察到的联合分布的性质,进一步定义了一种从已观察到的变量中引入因果模型来推断未观察到变量的统计性质的学习场景,并且通过推导因果模型的 VC 维,得出了预测的泛化界限。
May, 2023
我们研究了在存在潜在变量的条件下学习因果结构的复杂任务,包括定位潜在变量和确定它们的数量,以及确定潜在和观察变量之间的因果关系。我们提出了一种用于线性非高斯非循环因果模型(包括潜在变量)的广义独立噪声(GIN)条件,该条件确定了某些测量变量的线性组合与其他测量变量之间的独立性。通过与GIN的图形准则的比较,我们发现独立噪声条件可以看作是GIN的特殊情况。借助所提出的GIN条件和精心设计的搜索程序,我们进一步高效地估计了线性非高斯潜在层次模型(LiNGLaHs),其中潜在变量可能具有因果关系,甚至可能遵循层次结构。实验结果证明了所提出方法的有效性。
Aug, 2023
使用有向无环图来建模系统的因果结构。在多个数据源(群体或环境)的数据聚合中,全局混淆模糊了许多因果发现算法中的条件独立性属性。因此,现有的因果发现算法不适用于多源设置。我们证明,如果混淆的基数有限(即数据来自有限数量的源),仍然可以实现因果发现。该问题的可行性取决于全局混淆因素的基数、观测变量的基数和因果结构的稀疏程度的权衡。
Nov, 2023
在存在自我遮蔽缺失情况下,探索从缺失数据中学习因果结构的识别问题是一项具有挑战性的任务,然而我们发现最近引入的加性噪声模型具有潜力用于解决这个问题。本研究通过扩展因果骨架的可识别范围,给出了加性噪声模型下因果方向的充分和必要的识别条件,并提出了一种基于该理论结果的实用算法来学习因果结构。通过对合成数据和真实数据的广泛实验,证明了该算法的高效性和有效性。
Dec, 2023
本研究介绍了一种使用线性非高斯模型的广义的、统一的局部因果发现方法,无论是循环还是非循环。我们将独立成分分析的应用从全局上下文扩展到独立子空间分析,能够从目标变量的马尔科夫毯中准确识别等效的局部有向结构和因果强度。对于特殊的非循环场景,我们还提出了一种基于回归的替代方法。我们的可识别性结果在合成和真实数据集上得到了实证验证。
Mar, 2024
本研究解决了因果发现领域中基于监督学习方法可能导致的误导性结果问题,提出了一种无监督的二变量因果发现方法。通过使用稳健的互信息度量,考虑了不同变量类型的影响,提供了一组标准的无偏结果,以指导未来在完全未知环境下的因果发现任务。
Aug, 2024