具有连续处理的双无偏机器学习非参数推断

Apr, 2020

具有连续处理的双无偏机器学习非参数推断

Double Debiased Machine Learning Nonparametric Inference with Continuous Treatments

Kyle Colangelo, Ying-Ying Lee

TL;DR本文提出了一种基于双无偏机器学习 (DML) 的非参数推断方法，用于连续治疗变量的因果效应估计，同时解决了无遗漏条件和非参数 / 高维麻烦参数的问题，并通过利用基于核的双重稳健矩函数和交叉拟合提供了高级条件，以实现估计的无偏性。

Abstract

We propose a nonparametric inference method for causal effects of continuous treatment variables, under unconfoundedness and nonparametric or high-dimensional nuisance parameters. Our →

causal inference nonparametric double debiased machine learning kernel-based monte carlo simulations

发现论文，激发创造

双重可靠估计连续处理效应的非参数方法

本文提出一种新的核平滑方法，可以在不需要参数模型的情况下，对连续治疗（如剂量）进行因果效应估计，并允许处理密度或结果回归的错误规范。方法经过了模拟证明，并应用于护士人员配备对医院复诊惩罚的研究中。

Jul, 2015

定位去偏机器学习：基于分位数处理效应的高效推断及其扩展

通过局部修正的去偏机器学习方法，在因果推理中实现高效的参数估计，特别地，估计 (本地) 量化处理效应中高维干扰项内含参数的情况，格式为收敛速率条件松弛时远优于使用未知真实干扰项的估计器。

Dec, 2019

双 / 去偏 / Neyman 机器学习治疗效应

应用机器学习方法解决高维数据下模型参数估计问题的方法被推广到了观测数据的平均处理效应估计，通过使用 Neyman-orthogonal scores 和交叉配对等技术进行设备参数的估计。

Jan, 2017

双重 / 无偏机器学习用于处理和因果参数

本文提出了一种新方法，双重机器学习 (Double ML)，用于解决因变量的原因关系，利用多种主要和辅助机器学习预测模型解决辅助和主关键参数预测，通过 K 折采样交叉拟合解决过拟合问题。

Jul, 2016

固定效应下的静态面板模型的双机器学习

我们开发了从面板数据中估计政策干预措施的估计量，允许混淆回归因子的非线性效果，并使用三个著名的机器学习算法（LASSO、分类和回归树以及随机森林）来研究这些估计量的性能。

Dec, 2023

连续治疗的双重稳健近端因果学习

我们提出了基于核的 DR 估计器，可以处理连续的处理方式，并通过充分性证明其正态形式是影响函数的一致近似。我们还提出了一种高效解决干扰函数的新方法，并以均方误差为指标进行了全面的收敛性分析，证明了我们估计器在合成数据集和实际应用中的实用性。

Sep, 2023

双机器学习估计因果效应 -- 方法评估

通过对模拟数据和真实世界数据的性能比较，本文评估了一种名为 “双重 / 无偏机器学习”（DML）的方法，在估算因果效应时，使用机器学习放宽了传统假设的限制。我们发现，将灵活的机器学习算法应用于 DML 可以提高对各种非线性混淆关系的调整，从而避免了传统因果效应估计中通常需要的功能形式假设。然而，我们证明这种方法仍然严重依赖于因果结构和识别的标准假设。在我们的应用中，估计空气污染对房价的影响时，我们发现 DML 估计结果一直比不太灵活的方法估计结果要大。基于我们的整体结果，我们为研究人员在实际应用 DML 时提供了可行的建议。

Mar, 2024

基于双机器学习的非混淆下程序评估

本论文旨在使用基于双重机器学习的方法对程序评估进行调整并进行扩展，并利用瑞士积极劳动力市场政策的多个程序进行评估。提出了规范化 DR-learner (NDR-learner) 方法来稳定个性化效果估计，从而更好地解决了 DR-learner 方法的局限性。

Mar, 2020

反事实推论和个体治疗效果的合规推断

本篇研究提出了一种基于符合性推断的方法，用于在潜在结果框架下产生反事实和个体治疗效果的可靠区间估计，适用于完全随机或分层随机试验，以及遵循强忽略性假设的一般观测研究。同时，该方法在机器学习算法的条件平均治疗效应估计上表现出了良好的优势。

Jun, 2020

快速非参数条件密度估计

通过建立 full density 模型 f (yjx) 而非只有期望值 E (yjx)，条件密度估计广义了回归。本文提出了双核条件密度估计器，并引入了基于双数树的快速算法，用最大似然准则进行带宽选择，从而在处理多变量数据集时取得 380 万倍的加速。

Jun, 2012