估计位置偏差,无需干扰干预
提出了一种基于上下文的地位模型(CPBM),使考试偏见可能依赖于描述查询和用户的上下文向量,并基于干预收获提出了有效的 CPBM 估计器,用于从搜索引擎和推荐系统的隐式反馈中进行无偏学习排序。在 ArXiv 搜索引擎上进行的实际实验以及在 Yahoo Learning-To-Rank 数据集上进行的半合成实验表明了新方法的优越性和鲁棒性。
Nov, 2018
本文提出了一种名为 DLA 的双重学习算法,该算法可以联合学习无偏好排名和无偏好倾向模型,以直接从有偏好的点击数据中学习无偏好排名模型,避免了对点击数据的特殊要求,实现了自适应学习和在线学习。实验结果表明,使用 DLA 训练的模型明显优于基于结果随机化和基于点击模型提取的相关信号的无偏好学习至排名算法。
Apr, 2018
提出了一种元学习方法,受非对称三训练框架的启发,利用两个预测器生成可靠的伪评分数据和另一个预测器进行最终预测,以解决推荐系统中观察到的评分数据选择偏差问题,实现从有偏显式反馈中开发出有效的推荐。
Sep, 2019
本文介绍了排名系统中模拟文档相关性的目的,并测试了几个特征的性质。将逆倾向权重方法用于文档可创建不偏的文档相关性估计特征,该特征可以准确地近似相关性,在理想情况下实现接近最佳的排名。然而,此特征具有较高的方差,且方差随着位置偏差的增加而增加。不准确的位置偏差估计导致性能下降。本文强调了准确估计位置偏差的必要性,并独特地提出了同时使用有偏和无偏位置偏差特征的建议。
Feb, 2024
研究了点击偏见与信任偏见的存在,提出了一种基于仿射修正的估算器,该估算器是目前唯一被证明能够去除二者影响的,并利用半合成实验证明在消除这些偏见的情况下,CLTR 可以更接近最佳排名系统。
Aug, 2020
本文提出了一种能够同时解决学习算法固有的和训练数据中的算法和应用中置入偏见的公平性问题的排序方法,采用一类延迟策略梯度方法,即采用公平度量的代价函数,并针对所需的应用程序选择一类的 “平均公平度量” 选择公平度量,有效地使学习算法能够处理包含偏差和噪声的数据,并通过对算法进行实证研究证明其能够获得准确而公平的排序策略。
Nov, 2019
本研究探讨了在选择偏差存在的情况下从明确评分反馈进行离线推荐学习的方法,在推荐偏差的解决方案中,逆偏重评分(IPS)估计是一个当前很有前途的解决方案,但基于倾向性的现有方法的性能会受到倾向性估计偏差的显着影响。因此,我们提出了一种新的算法,该算法通过对抗学习来最小化理论上的偏差,以达到在实际情况中优于一系列现有方法的效果。
Oct, 2019
本文提出了一种针对级联点击模式(CM)场景下的倾向性估计方法(CM-IPS),该方法在用户遵循 CM 点击搜索结果并具有极高表现的情况下,能使 CLTR 表现保持接近于全信息量表现,同时在用户遵循 PBM(Poisson Binomial Model)情况下,该方法不仅表现不佳,反而导致更大偏差,因此需要根据历史用户点击数据来选择使用 CM-IPS 或 PBM-based 倾向性估计方法。
May, 2020