估计位置偏差，无需干扰干预

Dec, 2018

Estimating Position Bias without Intrusive Interventions

Aman Agarwal, Ivan Zaitsev, Xuanhui Wang, Cheng Li, Marc Najork...

TL;DR本文介绍了一种在不涉及人工参照或限制相关性建模假设的前提下，从历史反馈日志中收集一种特定类型的干预数据并使用极值估计器以获得一致倾向性估计的方法，该方法在 Arxiv 全文搜索和谷歌 Drive 搜索等两个实际系统中提供了更好的倾向性估计。

Abstract

presentation bias is one of the key challenges when learning from implicit feedback in search engines, as it confounds the relevance signal. While it was recently shown how counterfactual →

presentation bias learning-to-rank counterfactual propensity estimates feedback logs

发现论文，激发创造

具有偏差反馈的无偏学习排序

通过对因果推断框架的提出，使用倾向权重排序支持向量机从隐式反馈学习，消除了数据偏差问题，取得了更好的结果。

Aug, 2016

基于语境的考察偏倚估计的干预收集

提出了一种基于上下文的地位模型（CPBM），使考试偏见可能依赖于描述查询和用户的上下文向量，并基于干预收获提出了有效的 CPBM 估计器，用于从搜索引擎和推荐系统的隐式反馈中进行无偏学习排序。在 ArXiv 搜索引擎上进行的实际实验以及在 Yahoo Learning-To-Rank 数据集上进行的半合成实验表明了新方法的优越性和鲁棒性。

Nov, 2018

使用无偏倾向估计的无偏学习排序

本文提出了一种名为 DLA 的双重学习算法，该算法可以联合学习无偏好排名和无偏好倾向模型，以直接从有偏好的点击数据中学习无偏好排名模型，避免了对点击数据的特殊要求，实现了自适应学习和在线学习。实验结果表明，使用 DLA 训练的模型明显优于基于结果随机化和基于点击模型提取的相关信号的无偏好学习至排名算法。

Apr, 2018

学习排序系统中的选择偏差校正

该研究考虑推荐系统中的不同偏差对算法性能的影响，提出新的反事实方法以解决位置和选择偏差，实验证明这些方法对噪声更具鲁棒性并具有更高精确度。

Jan, 2020

用于去偏差缺失非随机显式反馈的不对称三训练

提出了一种元学习方法，受非对称三训练框架的启发，利用两个预测器生成可靠的伪评分数据和另一个预测器进行最终预测，以解决推荐系统中观察到的评分数据选择偏差问题，实现从有偏显式反馈中开发出有效的推荐。

Sep, 2019

特征中的位置偏差

本文介绍了排名系统中模拟文档相关性的目的，并测试了几个特征的性质。将逆倾向权重方法用于文档可创建不偏的文档相关性估计特征，该特征可以准确地近似相关性，在理想情况下实现接近最佳的排名。然而，此特征具有较高的方差，且方差随着位置偏差的增加而增加。不准确的位置偏差估计导致性能下降。本文强调了准确估计位置偏差的必要性，并独特地提出了同时使用有偏和无偏位置偏差特征的建议。

Feb, 2024

当倒数权重法无效时：用仿射校正进行无偏置排序学习

研究了点击偏见与信任偏见的存在，提出了一种基于仿射修正的估算器，该估算器是目前唯一被证明能够去除二者影响的，并利用半合成实验证明在消除这些偏见的情况下，CLTR 可以更接近最佳排名系统。

Aug, 2020

公平且无偏的排名函数的策略梯度训练

本文提出了一种能够同时解决学习算法固有的和训练数据中的算法和应用中置入偏见的公平性问题的排序方法，采用一类延迟策略梯度方法，即采用公平度量的代价函数，并针对所需的应用程序选择一类的 “平均公平度量” 选择公平度量，有效地使学习算法能够处理包含偏差和噪声的数据，并通过对算法进行实证研究证明其能够获得准确而公平的排序策略。

Nov, 2019

解决离线推荐学习中的倾向性矛盾问题

本研究探讨了在选择偏差存在的情况下从明确评分反馈进行离线推荐学习的方法，在推荐偏差的解决方案中，逆偏重评分（IPS）估计是一个当前很有前途的解决方案，但基于倾向性的现有方法的性能会受到倾向性估计偏差的显着影响。因此，我们提出了一种新的算法，该算法通过对抗学习来最小化理论上的偏差，以达到在实际情况中优于一系列现有方法的效果。

Oct, 2019

基于级联模型的倾向性估计，用于反事实学习排序

本文提出了一种针对级联点击模式（CM）场景下的倾向性估计方法（CM-IPS），该方法在用户遵循 CM 点击搜索结果并具有极高表现的情况下，能使 CLTR 表现保持接近于全信息量表现，同时在用户遵循 PBM（Poisson Binomial Model）情况下，该方法不仅表现不佳，反而导致更大偏差，因此需要根据历史用户点击数据来选择使用 CM-IPS 或 PBM-based 倾向性估计方法。

May, 2020