Sep, 2023

抵消干扰稳健推理的凸框架

TL;DR我们研究了关于未观测到的混淆因素的离线情境赌博的政策评估。我们提出了一个通用的估计器,使用凸规划方法提供政策价值的一个锐利下界,具有各种扩展应用和强有力的理论保证。