Sep, 2023

识别性问题:揭示偏向的学习排序中隐藏的可恢复条件

TL;DR应用无偏学习排序 (Unbiased Learning to Rank, ULTR) 于训练基于偏差点击日志的无偏排序模型,在明确用户行为生成过程并根据检验假设拟合点击数据的基础上,研究发现点击数据完美拟合时可以恢复真实潜在相关性,但实际上并非总能实现,从而导致排序性能明显降低。本研究旨在解决当数据集的图连通性被破坏时,从点击数据恢复真实相关性的问题,并提出了节点干预和节点合并两种方法来修正数据集并恢复图连通性,通过仿真数据集和两个 LTR 基准数据集的实证结果验证了我们提出的定理的有效性,同时证明了在相关性模型不可辨识时我们的方法在减轻数据偏差方面的有效性。