BriefGPT.xyz
Jun, 2019
分布式稳健的反事实风险最小化
Distributionally Robust Counterfactual Risk Minimization
HTML
PDF
Louis Faury, Ugo Tanielian, Flavian Vasile, Elena Smirnova, Elvis Dohmatob
TL;DR
本文介绍了使用分布式鲁棒优化(DRO)解决交叉事实风险最小化(CRM)问题的想法,并证明了DRO是对策反决策的一种有原则的工具。我们提出了使用Kullback-Leibler马氏距离作为CRM中不确定性的代替方法,并基于这一方法提出了一种新的鲁棒对策反目标。通过实验证明,在实践中使用其他不确定性度量具有重要意义。
Abstract
This manuscript introduces the idea of using
distributionally robust optimization
(DRO) for the
counterfactual risk minimization
(CRM) problem. Tapping into a rich existing literature, we show that DRO is a princ
→