SIGIRMay, 2020

反事实学习排序的加速收敛

TL;DR本文提出了一种名为 CounterSample 的新型学习算法,通过 Inverse Propensity Scoring 和 Stochastic Gradient Descent 解决 Counterfactual Learning to Rank 中导致收敛速度慢的 IPS weights 问题,同时在多个 biased LTR scenarios 中具有更快的收敛速度和更好的表现。