SIGIRMay, 2020

面向前 k 名排名的策略感知无偏学习排序

TL;DR本文介绍的计数事实学习 (LTR) 方法,使用包含交互偏差的已记录的用户交互来优化排名系统,通过引入一种新的策略感知的计数事实估计器,该方法可以适应随机记录策略的影响。同时,本文中还提出了一些传统 LTR 方法的新扩展方法,用于执行计数事实 LTR 并优化 top-k 评估指标,这些贡献介绍了首个可以应用于搜索和推荐中的非偏置 LTR 方法。