核工具变量回归

Jun, 2019

Kernel Instrumental Variable Regression

Rahul Singh, Maneesh Sahani, Arthur Gretton

TL;DR该研究提出了一种非参数化的核工具变量回归方法，可以应用于探索观察数据中因果关系，并在实验中得到非常好的表现。

Abstract

Instrumental variable (IV) regression is a strategy for learning causal relationships in observational data. If measurements of input X and output Y are confounded, the causal relationship can nonetheless be identified if an instrumental variable Z is available that influences X direct

causal relationship instrumental variable regression nonparametric reproducing kernel hilbert spaces two-stage least squares algorithm

发现论文，激发创造

双工具变量回归

介绍了一种新颖的算法 DualIV 用以解决非线性仪器变量回归问题，并且通过凸 - 凹鞍点问题得到比传统二阶段方法更简化的方案，同时构建了一种基于核函数的解析算法，该算法与现有的更复杂算法相比具有竞争力。

Oct, 2019

条件工具变量回归与表示学习用于因果推断

本文研究了在存在未观察到的混淆因素的情况下，从观察数据中估计因果效应的复杂问题。我们使用条件性工具变量（CIV）来缓解标准工具变量方法中的无混淆工具变量条件，并提出一种基于混淆平衡表征学习的非线性 CIV 回归，CBRL.CIV，以非线性情况下共同消除未观察到的混淆因素的混淆偏差并平衡观察到的混淆因素，无需线性假设。我们从理论上证明了 CBRL.CIV 的合理性。对合成数据集和两个实际数据集进行的大量实验证明了 CBRL.CIV 与最先进的基于工具变量的估计器相比的竞争性能以及在处理非线性情况方面的优越性。

Oct, 2023

工具变量回归中学习深度特征

本研究提出了一种新的方法，即深度特征工具变量回归（DFIV），用于解决仪器、处理和结果之间可能是非线性关系的情况。通过训练深度神经网络，定义仪器和处理的信息非线性特征。采用交替训练模式确保优良的端到端性能，解决了应用传统仪器变量回归可能存在的局限性，可有效提高其应用范围和性能。

Oct, 2020

通过双机器学习学习决策策略的工具变量

利用双 / 去偏机器学习框架设计的 DML-IV 算法，有效减小两阶段 IV 回归中的偏差并学习高性能策略。

May, 2024

因果推断与机器学习中的工具变量方法：一项调查

介绍和讨论 IV 方法及其在因果推断和机器学习中的应用，主要包括两阶段最小二乘法、控制函数和 IV 评估；总结了实际应用场景中的数据集和算法，并讨论了未来研究的方向和问题。

Dec, 2022

非参数工具变量回归通过随机近似梯度

本文提出了 SAGD-IV, 一种新颖的非参数工具变量回归框架，通过使用随机近似梯度来最小化投影总体风险。我们在理论上支持了算法，并通过实证实验证明了它的竞争性能。此外，我们也着重研究了二元结果的情况并取得了有希望的结果。

Feb, 2024

存在工具变量的非参数推断方法

本文提出基于核方法和正交级数的两种非参数方法，用于在工具变量存在时估计回归函数，首次推导出了最优收敛速度，同时表明这些估计量是在特定条件下实现的。在工具变量存在的情况下，确定回归函数的关系也定义了一类 “困难” 的逆问题，其 “困难” 的程度取决于内生与工具变量的联合密度函数的特征值，同时阐明了问题困难程度在确定最优收敛速率和适当的平滑参数选择方面所起的作用。

Mar, 2006

使用深度生成模型的条件工具因果推断

本文提出了一种基于深度生成模型的数据驱动方法，用于从含有潜在混淆因素的数据中学习条件工具变量及其调节集的信息表示，并实现平均因果效应估计。通过大量的合成和实际数据实验，证明该方法优于现有的 IV 方法。

Nov, 2022

基于流数据的工具变量回归的随机优化算法

通过将问题视为条件随机优化问题，我们开发并分析了工具变量回归算法。在最小二乘工具变量回归的背景下，我们的算法既不需要矩阵求逆也不需要小批量处理，并为使用流数据进行工具变量回归提供了完全的在线方法。当真实模型是线性的时，对于任意的正数 iota，在具有两个样本和一个样本估计器的情况下，我们推导出期望意义下的收敛速度，分别为 O (log T/T) 和 O (1/T^(1-iota))，其中 T 是迭代次数。重要的是，在具有两个样本估计器的情况下，我们的方法避免了显式建模和估计混淆因子与工具变量之间的关系，展示了该方法相对于基于重定义问题为极小化极大化优化问题的最近工作的优势。数值实验验证了理论结果。

May, 2024

使用工具变量估计纵向数据中具有时间依赖潜在混杂因素的因果推断

提出了一种新的时间依赖仪器因子模型（TIFM）来从具有隐藏时间依赖混杂因素的数据中估计时变因果效应，并用循环神经网络（RNN）架构辅助推断潜在仪器变量以解决混淆偏差问题。

Dec, 2023