C-XGBoost:一种用于因果效应估计的树提升模型
提出了一种针对小效应、异质性效应和强混淆情况下估计异质性治疗效应的新型非线性回归模型,它通过直接将倾向函数估计值纳入响应模型的规范化中,隐式地在回归函数上产生一个协变量依赖的先验,从而回避了标准非线性回归模型在针对混淆强的数据上所产生的治疗效应估计偏倚的问题。同时,这种基于贝叶斯因果森林模型的方法使得治疗效应的异质性能够被分别规范化,从而实现对异质性进行信息收缩。通过对一项关于吸烟对医疗支出因果效应的观察性研究重新分析和广泛的模拟研究,我们表明了这些好处。
Jun, 2017
近年来,对使用机器学习技术估计治疗效果的兴趣逐渐增长。本文讨论和分类了这些模型的算法归纳偏差,并提出了一种考虑因果图中的附加信息的新模型 NN-CGC,通过对模型实施新的约束,解决了来自虚假变量相互作用造成的偏差,并且可以与其他表征学习方法集成。我们使用三种不同的基础模型对我们的方法进行有效性测试,结果表明,我们的模型约束带来了显著的改进,在治疗效果估计方面取得了最新的全球领先成果。我们还展示了我们的方法对不完整因果图的鲁棒性,并且使用部分因果信息要优于忽略它。
Apr, 2024
通过创新 GBDT 算法的两种方法,即序贯学习和克服反事实性,用于 uplift modeling,该研究提出了一种能够优化资源分配、最大化整体回报的客户激励估计模型,并且在大规模数据集上的实验证明了该方法的有效性。为了方便应用,还开发了针对 uplift modeling 的具体设计的树提升系统 UTBoost。
Dec, 2023
本文研究了试验或观察研究中估计因果效应异质性的问题以及在子群体之间进行处理效应差异大小的推断。提出了一种新的交叉验证标准来确定因果效应的预测是否准确,并将该方法应用于一个大规模的针对搜索引擎的实验。
Apr, 2015
本研究提出了一种基于树模型进行模型平均的方法,旨在提高分布式数据网络下个性化治疗效果 (CATE) 估计精度,包括通过站点划分与模型组合来建模数据源异质性等。该方法通过真实世界数据的研究和全面的仿真实验表明其性能和提高治疗效果估计的实用价值。
Mar, 2021
本文提出并评估贝叶斯加性回归树(BART)与其他已有方法(如 IPTWM、TMLE、向量匹配和回归调整等)在多个处理方式时,因为结果是二进制的而缺乏强大的估计因果效应的方法。结果表明,在处理分配和结果生成机制的非线性和非可加性的情况下,BART、TMLE 和采用广义提升模型(GBM)的 IPTW 提供更好的偏差降低和较小的均方根误差,本文还提出了一种用于特定处理的共同支持区域来获得更好的外推结果和保持推断的方法。
Jan, 2020
本文介绍了一种非参数因果森林方法,用于估计异质性处理效应,并讨论了一种实用方法以构建渐近置信区间来评估真实处理效应,结果表明在存在无关协变量的情况下,因果森林方法比最近邻匹配等经典方法更为有效。
Oct, 2015
介绍了一种利用机器学习和统计学中的任何监督式学习或回归方法来估计条件平均处理效应(CATE)函数的元算法,其中包括一种新的元学习者 X-learner,通过广泛的模拟研究和两个政治学实验表明该算法的有效性和应用。
Jun, 2017
这篇论文主要讨论了利用机器学习和计量经济学方法来预测及估计治疗效果中的个性化处理效应,作者使用了 meta-learner,比如的 Doubly-Robust, R-, T - 和 X-learner,以及专门设计来估计 CATE 的工具如因果 BART 和广义随机森林,通过两个实证案例 - 小额信贷可利用性和 401 (k) 养老计划资格的影响与效果,发现所有观察值均具正面的治疗效应,但存在不同的效应异质性。
Apr, 2021