The page presentation biases in the information retrieval system, especially
on the click behavior, is a well-known challenge that hinders improving ranking
models' performance with implicit user feedback. Unbiased Learning to
Rank~(ULTR) algorithms are then proposed to learn an unbias
本文提出了一种名为 DLA 的双重学习算法,该算法可以联合学习无偏好排名和无偏好倾向模型,以直接从有偏好的点击数据中学习无偏好排名模型,避免了对点击数据的特殊要求,实现了自适应学习和在线学习。实验结果表明,使用 DLA 训练的模型明显优于基于结果随机化和基于点击模型提取的相关信号的无偏好学习至排名算法。