使用因果森林估计治疗效果:一个应用
本文介绍了一种非参数因果森林方法,用于估计异质性处理效应,并讨论了一种实用方法以构建渐近置信区间来评估真实处理效应,结果表明在存在无关协变量的情况下,因果森林方法比最近邻匹配等经典方法更为有效。
Oct, 2015
本研究旨在使用反事实框架结合随机森林 (RF) 来估计个体治疗效应,不受观察数据中共变量和选择偏差影响,并通过对比实验发现,针对共变量自适应的方法优于其他方法,以此揭示了药物使用与性风险之间的重要联系。
Jan, 2017
我们提出并实施了一种方法,通过基于广义线性模型比较的新颖节点分割过程,修改因果森林以针对相对风险目标。我们展示了对模拟和真实数据的结果,表明相对风险因果森林可以捕捉到未观察到的异质性来源。
Sep, 2023
提出了一种针对小效应、异质性效应和强混淆情况下估计异质性治疗效应的新型非线性回归模型,它通过直接将倾向函数估计值纳入响应模型的规范化中,隐式地在回归函数上产生一个协变量依赖的先验,从而回避了标准非线性回归模型在针对混淆强的数据上所产生的治疗效应估计偏倚的问题。同时,这种基于贝叶斯因果森林模型的方法使得治疗效应的异质性能够被分别规范化,从而实现对异质性进行信息收缩。通过对一项关于吸烟对医疗支出因果效应的观察性研究重新分析和广泛的模拟研究,我们表明了这些好处。
Jun, 2017
通过开发一个全连接的神经网络,实现了 Bayesian Causal Forest 算法的神经网络因果推断架构,并将该方法应用于研究应激对睡眠的影响,展示了在模拟环境中性能的提升。
May, 2024
机器学习和人工智能有潜力改变数据驱动的科学发现,通过准确预测多种科学现象。本文通过对治疗效果估计的因果推断任务进行研究,其中假设记录为高维图像的二元效果是在随机对照试验中进行的。我们发现,尽管这是最简单的设置且完全适合深度学习,但在文献中的许多常见选择可能导致有偏估计。通过在昆虫(Lasius neglectus)对微粒应用的群体间进行的 RCT 记录的实际基准测试下游因果推断任务,从最先进的视觉骨干中微调了 6,480 个模型,我们发现抽样和建模选择显著影响因果估计的准确性,并且分类准确性不能作为此的代理。我们进一步在控制因果模型的合成生成视觉数据集上重复验证分析。我们的结果表明,未来基准测试应认真考虑真实的下游科学问题,特别是因果关系问题。此外,我们强调了用于帮助回答科学领域的因果问题的表示学习方法的指南。所有的代码和数据将会发布。
May, 2024
本文主要研究如何从有限的数据中确定因果关系 —— 通过将先前的因果结构与贝叶斯估计相结合,该文提出了概率树作为可能的解决方案。研究发现,单一干预的信息增益、干预前的预期信息增益以及干预后预期得到的信息增益都有简单的表达式。因此给出了一种主动学习方法,即选择预期增益最高的干预方式,并通过几个例子予以说明;同时,该方法也展示了概率树及其参数的贝叶斯估计提供了一种简单而可行的快速因果归纳方法。
May, 2022
本文研究了试验或观察研究中估计因果效应异质性的问题以及在子群体之间进行处理效应差异大小的推断。提出了一种新的交叉验证标准来确定因果效应的预测是否准确,并将该方法应用于一个大规模的针对搜索引擎的实验。
Apr, 2015
提出了一种名为 C-XGBoost 的新因果推断模型,用于预测潜在结果,并使用树模型处理表格数据以及神经网络模型学习表征,同时具备 XGBoost 模型的优势,如处理缺失值和避免过拟合 / 偏差的能力。实验结果证明了该方法的有效性。
Mar, 2024
本文综述了在潜在结果框架下,针对观察数据的因果推断方法。这些方法分为两类,包括传统的统计学方法和最新的机器学习方法,还介绍了这些方法在广告、推荐、医学等领域的应用以及常用的基准数据集和开源代码。
Feb, 2020