WSDMDec, 2020

统一在线学习和反事实学习进行排序

TL;DR通过介入感知估计器建议一种优化基于用户交互的排名系统的新方法,以消除位置偏差、信任偏差和项目选择偏差。实验结果表明,相比现有方法,该新方法可以更有效地受益于在线干预。