因果发现的样本复杂度及领域专业知识的价值
本文提出了一种基于算法独立性的、使用随机复杂性解决离散数据条件互信息估计问题的测试方法SCI,此方法可以在有限的样本上找到合理的CMI阈值。实验证明SCI比常规测试具有更低的II类错误和更高的召回率,可应用于因果发现算法中。
Mar, 2019
我们提出了一种迭代因果发现算法(ICD),可在潜在混淆变量和选择偏差的情况下恢复因果图,并演示了 ICD 相较于 FCI、FCI+和RFCI算法,需要更少的CI测试并学习更准确的因果图。
Nov, 2021
通过引入贝叶斯-augmented的频率独立性检验方法,可以解决数据量不足的问题来改善局限于有限数据的约束性因果发现方法的性能,由实验也表明相比于目前最佳方法在精确度和效率方面都有显著提高。
Jun, 2022
本篇论文探讨如何在基于A*方法的因果关系发现中高效地整合多种类型的专家领域知识以减少图形搜索空间,并提供了潜在的计算增益分析。作者通过合成数据和真实数据的实验支持这些发现,表明即使少量领域知识都可以极大地提高A*方法的效率和实用性。
Aug, 2022
本研究对观测因果发现方法的实证表现进行了广泛的基准测试,发现基于分数匹配的方法在具有挑战性的情景中推断图的假阳性和假阴性率方面表现出令人惊讶的性能,并提供了理论洞察。该研究还首次尝试基于超参数值评估因果发现算法的稳定性。希望这篇论文能够为因果发现方法的评估树立新标准,并成为对该领域感兴趣的实践者的可访问入口,突出了不同算法选择的实证影响。
Oct, 2023
基于我们的估计器建立的多元分布的熵的非参数Von Mises估计器,在条件独立性测试这一关键步骤上受到启发,我们设计了一种基于估计器的条件独立性测试(VM-CI),在光滑性假设下达到了最优的参数速率。利用指数集中不等式,我们证明了VM-CI的总体误差的紧密上限。反过来,这使我们能够表征使用VM-CI进行条件独立性测试的任何基于约束的因果发现算法的样本复杂度。据我们所知,这是连续变量因果发现的首个样本复杂度保证。此外,我们经验证明,无论是时间复杂度还是样本复杂度(或两者兼有),VM-CI在性能上优于其他常见的条件独立性测试,这也反映在结构学习中表现出更好的性能。
Oct, 2023
使用有向无环图来建模系统的因果结构。在多个数据源(群体或环境)的数据聚合中,全局混淆模糊了许多因果发现算法中的条件独立性属性。因此,现有的因果发现算法不适用于多源设置。我们证明,如果混淆的基数有限(即数据来自有限数量的源),仍然可以实现因果发现。该问题的可行性取决于全局混淆因素的基数、观测变量的基数和因果结构的稀疏程度的权衡。
Nov, 2023
本研究旨在通过多项式数量的条件独立性测试来学习隐藏因果图的较粗糙表示,名为因果一致分区图(CCPG),它由顶点的一个分区和在其组件上定义的有向图组成,并满足方向性的一致性和其他有利于更细的分区的约束条件。此方法在因果图可识别的特殊情况下,通过多项式数量的测试,提供了首个有效的还原真实因果图的算法。
Jun, 2024