通过双机器学习学习决策策略的工具变量

ICMLMay, 2024

通过双机器学习学习决策策略的工具变量

Learning Decision Policies with Instrumental Variables through Double Machine Learning

Daqian Shao, Ashkan Soleymani, Francesco Quinzan, Marta Kwiatkowska

TL;DR利用双 / 去偏机器学习框架设计的 DML-IV 算法，有效减小两阶段 IV 回归中的偏差并学习高性能策略。

Abstract

A common issue in learning decision-making policies in data-rich settings is spurious correlations in the offline dataset, which can be caused by hidden confounders. Instrumental variable (IV) regression, which u

decision-making policies spurious correlations instrumental variable regression dml-iv causal relationships

发现论文，激发创造

工具变量回归中学习深度特征

本研究提出了一种新的方法，即深度特征工具变量回归（DFIV），用于解决仪器、处理和结果之间可能是非线性关系的情况。通过训练深度神经网络，定义仪器和处理的信息非线性特征。采用交替训练模式确保优良的端到端性能，解决了应用传统仪器变量回归可能存在的局限性，可有效提高其应用范围和性能。

Oct, 2020

因果推断与机器学习中的工具变量方法：一项调查

介绍和讨论 IV 方法及其在因果推断和机器学习中的应用，主要包括两阶段最小二乘法、控制函数和 IV 评估；总结了实际应用场景中的数据集和算法，并讨论了未来研究的方向和问题。

Dec, 2022

核工具变量回归

该研究提出了一种非参数化的核工具变量回归方法，可以应用于探索观察数据中因果关系，并在实验中得到非常好的表现。

Jun, 2019

使用深度生成模型的条件工具因果推断

本文提出了一种基于深度生成模型的数据驱动方法，用于从含有潜在混淆因素的数据中学习条件工具变量及其调节集的信息表示，并实现平均因果效应估计。通过大量的合成和实际数据实验，证明该方法优于现有的 IV 方法。

Nov, 2022

双工具变量回归

介绍了一种新颖的算法 DualIV 用以解决非线性仪器变量回归问题，并且通过凸 - 凹鞍点问题得到比传统二阶段方法更简化的方案，同时构建了一种基于核函数的解析算法，该算法与现有的更复杂算法相比具有竞争力。

Oct, 2019

学习条件工具变量表示以进行因果效应估计

利用分离表示学习的优势，提出了一种名为 DVAE.CIV 的新方法，用于从具有潜在混淆因素的数据中学习和分离 CIV 和其条件集的表示，并进行因果效应估计。对合成和真实世界数据集的广泛实验结果表明，与现有的因果效应估计方法相比，所提出的 DVAE.CIV 方法具有卓越的性能。

Jun, 2023

具有模型选择的正规化深度 IV

我们在本文中研究了非参数估计的工具变量（IV）回归，并提出了一种以最小化规则为目标的免去极小极值校正的方法，能够避免回归被唯一确定以及缺乏模型选择程序等三个限制，并在实际应用中能够实现一般函数逼近。

Mar, 2024

条件工具变量回归与表示学习用于因果推断

本文研究了在存在未观察到的混淆因素的情况下，从观察数据中估计因果效应的复杂问题。我们使用条件性工具变量（CIV）来缓解标准工具变量方法中的无混淆工具变量条件，并提出一种基于混淆平衡表征学习的非线性 CIV 回归，CBRL.CIV，以非线性情况下共同消除未观察到的混淆因素的混淆偏差并平衡观察到的混淆因素，无需线性假设。我们从理论上证明了 CBRL.CIV 的合理性。对合成数据集和两个实际数据集进行的大量实验证明了 CBRL.CIV 与最先进的基于工具变量的估计器相比的竞争性能以及在处理非线性情况方面的优越性。

Oct, 2023

Auto IV: 自动仪器变量分解实现反事实预测

本文提出了一种名为自动工具变量分解（AutoIV）算法来从观测变量（IV 候选变量）中自动生成具有 IV 角色的表达形式，通过最大化和最小化互信息约束来满足与处理和结果相关性和排除条件，以学习混淆因子及竞争信息以获得 IV 角色的表征，进而为基于 IV 的反事实预测生成有效的 IV 表征。

Jul, 2021

战略工具变量回归：从策略性反应中恢复因果关系

研究发现，当机器学习算法自动或参考作用于关于人的重大决策时，个体决策受到激励可通过策略性地修改自己的可观察属性以获得更有利的预测，导致预测所依赖的训练数据分布与实际使用的数据分布不同。但是，该文提出了一个新方法，通过观察部署模型的顺序可以将策略性响应与工具变量回归联系起来，从而有效地恢复我们想要预测的可观察特征和结果之间的因果关系，从而提高决策的公平性、代理结果和预测风险。

Jul, 2021