抵消干扰稳健推理的凸框架

Sep, 2023

A Convex Framework for Confounding Robust Inference

Kei Ishikawa, Naio He, Takafumi Kanamori

TL;DR我们研究了关于未观测到的混淆因素的离线情境赌博的政策评估。我们提出了一个通用的估计器，使用凸规划方法提供政策价值的一个锐利下界，具有各种扩展应用和强有力的理论保证。

Abstract

We study policy evaluation of offline contextual bandits subject to unobserved confounders. →