从有限总体数据中学习因果概率
本文针对决策问题,使用实验和观测数据推导出必要性和充分性(PNS)、充分性(PS)和必要性(PN)概率的尖锐边界。作者进一步提出了一种确定所需样本量的方法,并证明此样本量模拟稳定估计了 PNS 范围的界限。
Oct, 2022
本文讨论了在实践中如何改进用于现代决策的因果概率的界限,特别是在考虑到观测数据的情况下。研究者们定义并限定了三个二元概率,分别是 PNS,PS 和 PN,这些概率在确定性和必要性方面发挥着重要作用。研究主要使用观测和实验数据,探讨了这些数据的影响,以及如何将其应用于 Li 和 Pearl 定义的单位选择问题。
Oct, 2022
本文讨论在给定情境下估计一个事件是另一个事件的原因的概率,利用结构 - 语义定义的必需或充分因果关系的概率,我们展示了如何从实验和观察数据中获得这些数量的最佳约束,最小化了关于数据生成过程的假设,并从理论上得出了关于因果概率的严格边界,这些结果确定了如何在解决归因问题和决策相关问题中利用实证数据。
Jan, 2013
在子群体中的因果推断涉及确定干预对更大总体中特定子群体的因果效应。我们提出并倡导一种子群体中的因果推断问题(简称 s-ID),其中我们仅能访问目标子群体的观测数据(与整个总体相比)。现有的子群体推断问题基于所给数据分布源于整个总体的前提,因此无法解决 s-ID 问题。为了填补这一空白,我们提供了在因果图中必须满足的充分和必要条件,以确定从该子群体的观测分布中识别出子群体的因果效应。在给定这些条件的情况下,我们提出了一个对 s-ID 问题的完备的和可靠的算法。
Sep, 2023
本文介绍了如何在机器学习领域中利用 PNS(必要性和充分性的概率)计算特征重要性,并创建了新的特征重要性测量方法:PN-FI、PS_FI 和 PNS_FI。通过三个 RCT 得到的结果展示了三个特征(狗的鼻子,眼睛和嘴巴)的 PS_FI、PN_FI 和 PNS_FI 的计算方式,FI 值为紧密的上下界间的区间。
Aug, 2023
对于在临床、流行病学和公共政策应用中存在的具有不同治疗方案的外部数据集,提供一种在这种具有挑战性的情景中提供概率因果边界的符号化方法,这些边界适用于任意协变量和治疗的维度,并讨论了这些边界在现有文献中更紧的条件。
Oct, 2023
本文将原始因果概率(PoC)的概念从标量二元变量扩展到连续处理和结果变量,并进一步推广 PoC 来捕获多个处理和多个结果之间的因果效应。此外,我们考虑针对子群体的 PoC 以及包含多重假设条件的 PoC,以捕捉决策中更复杂的反事实信息。我们为介绍的每一类 PoC 提供了非参数识别定理。最后,我们通过一个关于教育的真实数据集来说明我们结果的应用。
May, 2024
本文提出了一种能学习到只包含和我们感兴趣的结果相关的因果相关变量的必要和充分因果图(NSCG)的方法,该方法使用了因果关系的概率。我们开发了一个基于分数的算法来学习 NSCG,并在模拟和真实数据的实证研究中展示了该算法的性能优于现有算法,并能揭示对于目标可遗传特征非常重要的酵母基因。
Jan, 2023