BriefGPT.xyz
Sep, 2023
抵消干扰稳健推理的凸框架
A Convex Framework for Confounding Robust Inference
HTML
PDF
Kei Ishikawa, Naio He, Takafumi Kanamori
TL;DR
我们研究了关于未观测到的混淆因素的离线情境赌博的政策评估。我们提出了一个通用的估计器,使用凸规划方法提供政策价值的一个锐利下界,具有各种扩展应用和强有力的理论保证。
Abstract
We study
policy evaluation
of
offline contextual bandits
subject to
unobserved confounders
.
→