BriefGPT.xyz
Ask
alpha
关键词
doubly-robust
搜索结果 - 1
估计记录策略的双重稳健离线策略评估
该研究介绍了一种新的双鲁棒离策评估(OPE)估计器,用于未知的日志策略和价值函数情况下,能估计产生半参数下界的最小渐近方差。
PDF
3 months ago
Prev
Next