关键词inverse propensity scoring
搜索结果 - 9
- $Δ ext {-}{m OPE}$:使用一对策略进行离策略估计PDF2 months ago
- 通过优化概括方法评估推荐策略的离策略算法PDF5 months ago
- KDD多样化用户行为下排名策略的离线评估PDFa year ago
- ICML离线学习的指数平滑PDFa year ago
- SIGIR基于曝光的风险最小化的反事实学习排序的安全部署PDFa year ago
- KDD双向 Transformer 用于顺序推荐中解决 Cloze 任务偏差问题PDFa year ago
- 当倒数权重法无效时:用仿射校正进行无偏置排序学习PDF4 years ago
- SIGIR反事实学习排序的加速收敛PDF4 years ago
- 基于上下文的赌博机中最优的自适应离线评估PDF8 years ago
Prev
Next