因果推断的双重稳健学习教程
提出了一种在现代数据丰富的环境中估计未观察到的混杂影响下的平均处理效应的新框架,该框架具有大量的单位和结果。该提出的估计器具有双重鲁棒性,结合了结果填充、逆概率加权和用于矩阵补全的新型交叉拟合程序。我们推导出有限样本和渐近保证,并且证明新估计器的误差以参数速率收敛到均值为零的高斯分布。模拟结果显示本文分析的估计器的形式性质的实际相关性。
Feb, 2024
通过对模拟数据和真实世界数据的性能比较,本文评估了一种名为 “双重 / 无偏机器学习”(DML)的方法,在估算因果效应时,使用机器学习放宽了传统假设的限制。我们发现,将灵活的机器学习算法应用于 DML 可以提高对各种非线性混淆关系的调整,从而避免了传统因果效应估计中通常需要的功能形式假设。然而,我们证明这种方法仍然严重依赖于因果结构和识别的标准假设。在我们的应用中,估计空气污染对房价的影响时,我们发现 DML 估计结果一直比不太灵活的方法估计结果要大。基于我们的整体结果,我们为研究人员在实际应用 DML 时提供了可行的建议。
Mar, 2024
我们提出了基于核的 DR 估计器,可以处理连续的处理方式,并通过充分性证明其正态形式是影响函数的一致近似。我们还提出了一种高效解决干扰函数的新方法,并以均方误差为指标进行了全面的收敛性分析,证明了我们估计器在合成数据集和实际应用中的实用性。
Sep, 2023
论文研究了在环境中收益只有部分观测可用的情况下如何进行顺序决策,提出了双重稳健估计技术用于政策评估和优化,证明了该方法在具有良好收益模型或过去政策模型的情况下都能产生准确的价值估计。
Mar, 2015
在这篇论文中,我们采用最近引入的无结构统计下界框架,证明了双重稳健估计器在平均处理效应以及对待处理群体的平均处理效应方面的统计优越性,以及这些估计器的加权变体,这在政策评估中广泛应用。
Feb, 2024
在具有上下文情境和目标函数的决策环境中,我们使用双重稳健技术评估新策略,并证明这种方法使价值估计具有较低的方差,且能达到更好的策略,为该领域提供一种有效的方法。
Mar, 2011
提出了一种更强健的双重鲁棒估计器(MRDR),利用双重学习方法实现其误差插值,从而提高对推荐系统中的后点击转化率进行估计的准确性。在半合成数据集和两个真实世界数据集上的实验证实了该方法的有效性。
May, 2021
推荐系统在用户评级其偏好项目时常受到选择偏差的困扰。本文提出了一种加倍稳健估计器及其改进类型,通过提供准确的修正误差或预测倾向来确保无偏估计。然而,现有的估计器依赖于粗糙模型的不准确修正误差和倾向评分,我们提出了一个加倍校准估计器,通过校准修正误差和倾向模型以提高估计器的效果。通过实证研究验证了我们的理论,并结合预测和修正模型一起进行了校准专家的三层联合学习,在真实数据集上的广泛实验中证明了加倍校准估计器在去偏推荐任务中的优越性。
Feb, 2024
比较两个数据样本,我们观察到一个结果变量分布的变化。在存在多个解释变量的情况下,我们开发了一种新的估计策略,结合回归和重新加权方法来量化每个因果机制的贡献。我们的提出方法是多重健壮的,意味着在部分错误规范化下仍能恢复目标参数。我们证明了我们的估计量是一致和渐进正态的。此外,它可以被纳入到 Shapley 值等现有的因果归因框架中,从而继承其一致性和大样本分布属性。我们的方法在蒙特卡洛模拟中表现出色,并且我们展示了其在实证应用中的实用性。
Apr, 2024