识别性问题：揭示偏向的学习排序中隐藏的可恢复条件

Sep, 2023

识别性问题：揭示偏向的学习排序中隐藏的可恢复条件

Identifiability Matters: Revealing the Hidden Recoverable Condition in Unbiased Learning to Rank

Mouxiang Chen, Chenghao Liu, Zemin Liu, Zhuo Li, Jianling Sun

TL;DR应用无偏学习排序 (Unbiased Learning to Rank, ULTR) 于训练基于偏差点击日志的无偏排序模型，在明确用户行为生成过程并根据检验假设拟合点击数据的基础上，研究发现点击数据完美拟合时可以恢复真实潜在相关性，但实际上并非总能实现，从而导致排序性能明显降低。本研究旨在解决当数据集的图连通性被破坏时，从点击数据恢复真实相关性的问题，并提出了节点干预和节点合并两种方法来修正数据集并恢复图连通性，通过仿真数据集和两个 LTR 基准数据集的实证结果验证了我们提出的定理的有效性，同时证明了在相关性模型不可辨识时我们的方法在减轻数据偏差方面的有效性。

Abstract

The application of unbiased learning to rank (ultr) is widespread in modern systems for training unbiased ranking models from biased click

unbiased learning to rank ultr ranking models identifiability graph data bias

发现论文，激发创造

无偏学习排名遇到现实：来自百度大规模搜索数据集的教训

通过对百度搜索引擎的实时数据集开展实证研究，发现无偏学习排序技术在点击预测方面有明显的性能提升，但这并不转化为在专家相关性标注中的排名性能改进，表明结论在很大程度上取决于基准评估方法。

Apr, 2024

具有偏差反馈的无偏学习排序

通过对因果推断框架的提出，使用倾向权重排序支持向量机从隐式反馈学习，消除了数据偏差问题，取得了更好的结果。

Aug, 2016

标量不足以描述：基于向量化的无偏学习排序

本文提出一种基于向量的解法，用于构建与点击、偏差和排序特征等相关联的、不受限制的点击概率模型，并基于此方法提出了一种名为统计向量化的自适应学习排序模型，实验证明其表现优于现有的无偏学习方法。

Jun, 2022

无偏学习排序：在线或离线？

本文通过对无偏学习进行形式化的定义，指出现有的离线无偏学习和在线排序学习算法只是同一问题的两个方面。研究人员进一步对 6 种现有的无偏学习算法进行了评估，并发现其中大部分算法都可以在离线和在线环境下使用，而且有一定的应用前景。

Apr, 2020

整页无偏学习排序

该文提出针对搜索结果页面展示的选择偏见问题的整体无偏学习排名问题，并介绍了一个自动发现和减轻多个 SERP 功能偏见的偏见无关整页无偏排序算法 BAL。

Oct, 2022

对反事实学习排序模型的鲁棒性进行的可复制性研究

通过广泛的基于仿真的实验，探究了现有的反事实学习排序模型在复杂和多样化情境下的稳健性，并发现 DLA 模型和 IPS-DCM 在各种仿真设置下展现出更好的稳健性，而 IPS-PBM 和 PRS 则较为脆弱；此外，当生产排序器具有较高的排序性能或存在一定的随机性时，现有的反事实学习排序模型往往无法超越简单的点击基准，因此迫切需要开发适用于这些情境的新的反事实学习排序算法。

Apr, 2024

随机化最小侵入式采集点击记录中的无偏好好处

通过处理搜索结果展示方式，消除展示偏见获取更客观的用户隐式反馈，取得更佳的排序效果。

May, 2006

公平且无偏的排名函数的策略梯度训练

本文提出了一种能够同时解决学习算法固有的和训练数据中的算法和应用中置入偏见的公平性问题的排序方法，采用一类延迟策略梯度方法，即采用公平度量的代价函数，并针对所需的应用程序选择一类的 “平均公平度量” 选择公平度量，有效地使学习算法能够处理包含偏差和噪声的数据，并通过对算法进行实证研究证明其能够获得准确而公平的排序策略。

Nov, 2019

克服在线学习排名中的先验错误规定

在线学习排序的领域，Bayesian ranking bandit algorithms 已被证明可以使用先前的知识来提高效能。本文提出并分析了自适应的算法，解决了现有工作需要匹配真实先验的主要局限性，并将这些结果扩展到线性和广义线性模型。此外，我们还考虑点击反馈措施，并通过合成和现实世界实验证明了我们算法的有效性。

Jan, 2023

使用无偏倾向估计的无偏学习排序

本文提出了一种名为 DLA 的双重学习算法，该算法可以联合学习无偏好排名和无偏好倾向模型，以直接从有偏好的点击数据中学习无偏好排名模型，避免了对点击数据的特殊要求，实现了自适应学习和在线学习。实验结果表明，使用 DLA 训练的模型明显优于基于结果随机化和基于点击模型提取的相关信号的无偏好学习至排名算法。

Apr, 2018