因果和结构效应的自动去偏机器学习
本文提出了一种新方法,双重机器学习 (Double ML),用于解决因变量的原因关系,利用多种主要和辅助机器学习预测模型解决辅助和主关键参数预测,通过 K 折采样交叉拟合解决过拟合问题。
Jul, 2016
通过神经网络和随机森林自动学习线性函数的 Riesz 表示,实现自动去偏并提高估计方法的精度,即使是针对高维或非参数回归函数。并且该方法对任意函数都有效,尤其在估计平均治疗效应功能上表现良好。
Oct, 2021
我们开发了从面板数据中估计政策干预措施的估计量,允许混淆回归因子的非线性效果,并使用三个著名的机器学习算法(LASSO、分类和回归树以及随机森林)来研究这些估计量的性能。
Dec, 2023
通过对模拟数据和真实世界数据的性能比较,本文评估了一种名为 “双重 / 无偏机器学习”(DML)的方法,在估算因果效应时,使用机器学习放宽了传统假设的限制。我们发现,将灵活的机器学习算法应用于 DML 可以提高对各种非线性混淆关系的调整,从而避免了传统因果效应估计中通常需要的功能形式假设。然而,我们证明这种方法仍然严重依赖于因果结构和识别的标准假设。在我们的应用中,估计空气污染对房价的影响时,我们发现 DML 估计结果一直比不太灵活的方法估计结果要大。基于我们的整体结果,我们为研究人员在实际应用 DML 时提供了可行的建议。
Mar, 2024
本文介绍了如何利用 efficient influence function 来构建基于统计 / 机器学习的 estimators,并讨论了这些 estimators 表现良好的前提条件。
Jul, 2021
本文提出了一种修正方法,使得套索法等稀疏回归方法可以用于高维线性模型的 sqrt {n}- 一致推断,而无需额外假设述评分数的可估计性,仅需要假设存在交集,即积分比例得分从 0 和 1 足够远。
Apr, 2016
我们提出了针对连续敏感变量的偏见缓解策略,该策略基于经济计量学领域的内生性概念,并采用弱监督学习方法,对一小部分可进行公平测量的数据进行处理。结果表明我们的方法对实际应用的效果非常接近。
Feb, 2024
研究调查了特定个体因果效应的度量 —— 条件平均处理效应(CATE)的估计和统计推断方法,使用线性模型定义 CATE 为这些线性模型的预期结果之间的差异,并通过高维线性回归方法进行一致性估计和统计推断,进一步使用双重 / 无偏机器学习(DML)和无偏 Lasso 技术减小偏差,通过模拟研究验证了方法的有效性。
Mar, 2024