使用基于优化的方法估计因果效应:综述与实证比较
本文综述了在潜在结果框架下,针对观察数据的因果推断方法。这些方法分为两类,包括传统的统计学方法和最新的机器学习方法,还介绍了这些方法在广告、推荐、医学等领域的应用以及常用的基准数据集和开源代码。
Feb, 2020
本研究综述了长期以来在联合随机对照试验(RCTs)和观察研究中进行因果推断的方法,旨在实现 “两全其美”。作者首先讨论了提高观察数据代表性的 RCTs 的识别和估计方法,然后探讨了将 RCTs 和观察数据结合使用以确保观察分析的无瑕性或提高(条件)平均治疗效果估计的方法。最后,作者使用模拟研究和真实世界数据比较了主要方法,并提供了可用代码和新实现。
Nov, 2020
本文研究了在可以进行一系列干预的因果模型中全局优化感兴趣的变量的问题,提出了一种新算法 Causal Bayesian Optimization (CBO),结合了因果推断、不确定性量化和序贯决策等思想,同时考虑了经典的探索 - exploitation 与新型的观测 - intervention 的平衡,通过应用于不同场景中,显示出了该方法的优越性。
May, 2020
在大数据时代,处于生态经济学、医疗保健、网络挖掘、在线广告和市场营销等多个领域的观测数据的因果关系进一步的理解异常重要。然而目前现有的因果效果评估方法主要集中在源特定和固定的观测数据上,缺乏对数据连续性、领域适配性以及海量数据的易用性等问题的持续性研究,而这些问题非常普遍。本论文定义了持续性治疗效果的评估问题,并提出了问题的研究难点和可能的解决方案。最后,我们还讨论了未来该领域的研究方向。
Jan, 2023
本文提出了一种方法,将观测数据和实验数据相结合,通过控制函数方法进行因果效应的估计,以解决可能存在未观测混淆变量的问题。该方法应用于课堂规模和第三年级考试成绩的数据,结论表明,课堂规模对学生学业成就有显著影响。
Jun, 2020
观察性研究常常存在客观性问题,本文讨论了如何通过仔细设计的方案来近似随机化实验,以获得更准确的因果推断。涉及的问题包括关键协变量数据缺失、治疗和对照组关键协变量分布的重叠度分析等,同时提出了可能的解决方案并分析了潜在结果的定义和因果效应的关键问题。
Nov, 2008
我们的研究将因果估计推广到具有任意个维度或可测空间的结果,将传统的因果估计用于名义变量作为因果差异检验,提出了一种简单的方法来调整普遍一致的条件独立性检验,并证明这些检验是普遍一致的因果差异检验。数值实验证明,我们的方法 Causal CDcorr 与现有策略相比,在有限样本的有效性和功效方面都有所改进。我们的方法都是开源的,可以在 github.com/ebridge2/cdcorr 获取。
Jul, 2023
给定一个随机对照试验,从中推理因果关系可能与一些效应修饰因子不同分布的目标人群无关。我们利用一个附加的观察研究学习到的预测模型,无需对该研究做任何假设来补充试验数据,提出了能够更好地推广试验结果的算法,并以理论和实证的方式展示了当观察研究是高质量时,我们的方法能够更好地推广,即使存在未测的混杂变量等情况仍能保持稳健。
Jun, 2024