Mar, 2020

针对未观察到的混淆因素的时序决策离线策略评估

TL;DR研究探讨当评估策略的绩效受到未观察到的混淆因素的影响时,如何通过开发最坏情况下的绩效边界来保证 OPE 方法的健壮性,并提出了一种计算最坏情况下边界的高效损失最小化过程,在两个模拟的医疗保健示例中证明了该方法的有效性。