双重 / 无偏机器学习用于处理和因果参数

Jul, 2016

双重 / 无偏机器学习用于处理和因果参数

Double/Debiased Machine Learning for Treatment and Causal Parameters

Victor Chernozhukov, Denis Chetverikov, Mert Demirer, Esther Duflo, Christian Hansen...

TL;DR本文提出了一种新方法，双重机器学习 (Double ML)，用于解决因变量的原因关系，利用多种主要和辅助机器学习预测模型解决辅助和主关键参数预测，通过 K 折采样交叉拟合解决过拟合问题。

Abstract

Most modern supervised statistical/machine learning (ML) methods are explicitly designed to solve prediction problems very well. Achieving this goal does not imply that these methods automatically deliver good estimators of →

machine learning causal parameters predictive models double ml k-fold sample splitting

发现论文，激发创造

因果和结构效应的自动去偏机器学习

本文利用机器学习进行自动去偏差，得出了高维回归的线性和非线性函数。不仅提供去偏差的标准误差，还给出了一系列的结构性和因果效应的估计量。应用于具体数据上得出了对待处理者的平均处理效应，以及 Nielsen 扫描仪数据中有价格和收入相关性的需求弹性。

Sep, 2018

双机器学习估计因果效应 -- 方法评估

通过对模拟数据和真实世界数据的性能比较，本文评估了一种名为 “双重 / 无偏机器学习”（DML）的方法，在估算因果效应时，使用机器学习放宽了传统假设的限制。我们发现，将灵活的机器学习算法应用于 DML 可以提高对各种非线性混淆关系的调整，从而避免了传统因果效应估计中通常需要的功能形式假设。然而，我们证明这种方法仍然严重依赖于因果结构和识别的标准假设。在我们的应用中，估计空气污染对房价的影响时，我们发现 DML 估计结果一直比不太灵活的方法估计结果要大。基于我们的整体结果，我们为研究人员在实际应用 DML 时提供了可行的建议。

Mar, 2024

固定效应下的静态面板模型的双机器学习

我们开发了从面板数据中估计政策干预措施的估计量，允许混淆回归因子的非线性效果，并使用三个著名的机器学习算法（LASSO、分类和回归树以及随机森林）来研究这些估计量的性能。

Dec, 2023

具有连续处理的双无偏机器学习非参数推断

本文提出了一种基于双无偏机器学习 (DML) 的非参数推断方法，用于连续治疗变量的因果效应估计，同时解决了无遗漏条件和非参数 / 高维麻烦参数的问题，并通过利用基于核的双重稳健矩函数和交叉拟合提供了高级条件，以实现估计的无偏性。

Apr, 2020

双 / 去偏 / Neyman 机器学习治疗效应

应用机器学习方法解决高维数据下模型参数估计问题的方法被推广到了观测数据的平均处理效应估计，通过使用 Neyman-orthogonal scores 和交叉配对等技术进行设备参数的估计。

Jan, 2017

预测模型可用于因果推断吗？

本研究考虑了在有因果关系的影响下，监督机器学习和深度学习算法能否在解释性和预测性之间实现平衡，并表明这种平衡可以通过紫珀（Pearl）的后门调整准则来实现。使用这种方法，不仅可以获得准确的预测，同时也可以大大提高模型的解释性和迁移性。

Jun, 2023

定位去偏机器学习：基于分位数处理效应的高效推断及其扩展

通过局部修正的去偏机器学习方法，在因果推理中实现高效的参数估计，特别地，估计 (本地) 量化处理效应中高维干扰项内含参数的情况，格式为收敛速率条件松弛时远优于使用未知真实干扰项的估计器。

Dec, 2019

双机器学习在因果混合建模中的应用 -- 地球科学中的应用

通过因果推断框架运用 Double Machine Learning（DML）估计混合模型，展示了在地球科学领域中估计因果参数的优势、对正则化方法偏差的鲁棒性以及避免等效多样性。该方法在碳通量配分中展现了适应异质因果效果的灵活性，并强调了明确定义因果图和关系的必要性，提倡这作为一般最佳实践，鼓励继续探索混合模型中的因果性以获得更可解释和可信赖的知识导向机器学习结果。

Feb, 2024

因果推断和半参数统计的约束学习

我们提出了一种新的校正方法 - 使用约束学习框架和 C-Learner 方法 - 来解决复杂干扰参数估计错误，并在多个数据集上进行实证分析，展示了其在因果估计中的高效性和性能优势。

May, 2024

基于高效影响函数的统计学习揭秘

本文介绍了如何利用 efficient influence function 来构建基于统计 / 机器学习的 estimators，并讨论了这些 estimators 表现良好的前提条件。

Jul, 2021