SIGIRMay, 2020
反事实学习排序的加速收敛
Accelerated Convergence for Counterfactual Learning to Rank
Rolf Jagerman, Maarten de Rijke
TL;DR本文提出了一种名为 CounterSample 的新型学习算法,通过 Inverse Propensity Scoring 和 Stochastic Gradient Descent 解决 Counterfactual Learning to Rank 中导致收敛速度慢的 IPS weights 问题,同时在多个 biased LTR scenarios 中具有更快的收敛速度和更好的表现。