推荐系统的多重鲁棒学习

AAAIJul, 2022

Multiple Robust Learning for Recommendation

Haoxuan Li, Quanyu Dai, Yuru Li, Yan Lyu, Zhenhua Dong...

TL;DR本文提出了一种多重稳健估计器，该估计器可以利用多个候选值进行无偏估计，并介绍了一种新的具有稳定性的多重稳健学习方法，实验结果表明，该方法具有优越的性能.

Abstract

In recommender systems, a common problem is the presence of various biases in the collected data, which deteriorates the generalization ability of the recommendation models and leads to inaccurate predictions. Doubly robust (DR) learning has been studied in many tasks in RS, with the a

recommender systems bias doubly robust learning multiple robust estimator generalization error

发现论文，激发创造

增强双重稳健学习用于除偏点击后转化率估计

提出了一种更强健的双重鲁棒估计器（MRDR），利用双重学习方法实现其误差插值，从而提高对推荐系统中的后点击转化率进行估计的准确性。在半合成数据集和两个真实世界数据集上的实验证实了该方法的有效性。

May, 2021

面向非随机丢失数据的双重校准推荐估计器

推荐系统在用户评级其偏好项目时常受到选择偏差的困扰。本文提出了一种加倍稳健估计器及其改进类型，通过提供准确的修正误差或预测倾向来确保无偏估计。然而，现有的估计器依赖于粗糙模型的不准确修正误差和倾向评分，我们提出了一个加倍校准估计器，通过校准修正误差和倾向模型以提高估计器的效果。通过实证研究验证了我们的理论，并结合预测和修正模型一起进行了校准专家的三层联合学习，在真实数据集上的广泛实验中证明了加倍校准估计器在去偏推荐任务中的优越性。

Feb, 2024

CDR: 保守双重稳健学习以消除偏向的推荐

为解决推荐系统中的数据偏差问题，本研究提出一种名为保守双重稳健策略（CDR）的方法，通过检验均值和方差来过滤造成负面影响的代入值。理论分析表明，CDR 具有降低方差和改善尾部边界的优势，并通过实证研究证明，CDR 显著提高了性能并减少了有害的代入值的频率。

Aug, 2023

更加健壮的双重偏差离线评估

本文针对强化学习中的离策略评估问题，提出了一种名为 MRDR 的更加鲁棒的 Doubly Robust 估计方法，该方法通过最小化 DR 估计器的方差来学习模型参数，并在上下文决策和强化学习基准问题中进行评估，证明了其强一致性和渐进最优性。

Feb, 2018

在去偏推荐中利用少量无偏评级平衡未观察到的混杂因素

本文提出了一种理论上保证的模型无关均衡方法，该方法可以针对现有的去偏差方法进行应用，以抵抗未观测到的混淆和模型错误，并通过交替校正学习偏差数据的模型参数，以自适应学习平衡系数，充分利用无偏数据。在实际应用中，该方法证明了其有效性。

Apr, 2023

因果推断的双重稳健学习教程

该论文介绍了双重稳健学习方法，旨在通过整合倾向得分和结果建模来从观测数据中进行因果推断。通过使用 EconML 软件包演示其应用，该论文消除了双重稳健方法的复杂性，并提供了实际的编程示例，旨在使数据科学和统计学的研究人员和从业人员可以更便捷地应用双重稳健学习方法。

Jun, 2024

去偏推荐算法与噪音数据

本文研究了推荐系统中用户对大多数物品的评级通常是非随机缺失，并提出了三种解决该问题的方法，分别是基于错误插补的方法（EIB）、倒数概率加权方法（IPS）和双重稳健方法（DR）。然而，这些方法忽略了另一种由观察到的评级和用户真实偏好之间不一致性所引起的偏差，即嘈杂反馈或结果测量误差。本研究进一步提出了一种交叉威胁的观点，旨在解决从缺失非随机数据和有噪声数据中学习预测模型的问题，并通过实验证明了所提方法的有效性。

Jun, 2024

用于去偏差缺失非随机显式反馈的不对称三训练

提出了一种元学习方法，受非对称三训练框架的启发，利用两个预测器生成可靠的伪评分数据和另一个预测器进行最终预测，以解决推荐系统中观察到的评分数据选择偏差问题，实现从有偏显式反馈中开发出有效的推荐。

Sep, 2019

一种深度循环生存模型用于无偏排序

本文提出了一种新的深度循环生存排序（DRSR）框架，以解决信息检索中的位置偏见问题，此框架利用循环神经网络模型上下文信息并综合采用生存分析和概率链规则来恢复一个用户各种行为的无偏联合概率，实现对用户的一系列行为进行关联建模。实验结果表明，相较于目前的一些模型，DRSR 能够显著提高性能。

Apr, 2020

连续治疗的双重稳健近端因果学习

我们提出了基于核的 DR 估计器，可以处理连续的处理方式，并通过充分性证明其正态形式是影响函数的一致近似。我们还提出了一种高效解决干扰函数的新方法，并以均方误差为指标进行了全面的收敛性分析，证明了我们估计器在合成数据集和实际应用中的实用性。

Sep, 2023