推荐系统的多重鲁棒学习
提出了一种更强健的双重鲁棒估计器(MRDR),利用双重学习方法实现其误差插值,从而提高对推荐系统中的后点击转化率进行估计的准确性。在半合成数据集和两个真实世界数据集上的实验证实了该方法的有效性。
May, 2021
推荐系统在用户评级其偏好项目时常受到选择偏差的困扰。本文提出了一种加倍稳健估计器及其改进类型,通过提供准确的修正误差或预测倾向来确保无偏估计。然而,现有的估计器依赖于粗糙模型的不准确修正误差和倾向评分,我们提出了一个加倍校准估计器,通过校准修正误差和倾向模型以提高估计器的效果。通过实证研究验证了我们的理论,并结合预测和修正模型一起进行了校准专家的三层联合学习,在真实数据集上的广泛实验中证明了加倍校准估计器在去偏推荐任务中的优越性。
Feb, 2024
为解决推荐系统中的数据偏差问题,本研究提出一种名为保守双重稳健策略(CDR)的方法,通过检验均值和方差来过滤造成负面影响的代入值。理论分析表明,CDR 具有降低方差和改善尾部边界的优势,并通过实证研究证明,CDR 显著提高了性能并减少了有害的代入值的频率。
Aug, 2023
本文针对强化学习中的离策略评估问题,提出了一种名为 MRDR 的更加鲁棒的 Doubly Robust 估计方法,该方法通过最小化 DR 估计器的方差来学习模型参数,并在上下文决策和强化学习基准问题中进行评估,证明了其强一致性和渐进最优性。
Feb, 2018
本文提出了一种理论上保证的模型无关均衡方法,该方法可以针对现有的去偏差方法进行应用,以抵抗未观测到的混淆和模型错误,并通过交替校正学习偏差数据的模型参数,以自适应学习平衡系数,充分利用无偏数据。在实际应用中,该方法证明了其有效性。
Apr, 2023
该论文介绍了双重稳健学习方法,旨在通过整合倾向得分和结果建模来从观测数据中进行因果推断。通过使用 EconML 软件包演示其应用,该论文消除了双重稳健方法的复杂性,并提供了实际的编程示例,旨在使数据科学和统计学的研究人员和从业人员可以更便捷地应用双重稳健学习方法。
Jun, 2024
本文研究了推荐系统中用户对大多数物品的评级通常是非随机缺失,并提出了三种解决该问题的方法,分别是基于错误插补的方法(EIB)、倒数概率加权方法(IPS)和双重稳健方法(DR)。然而,这些方法忽略了另一种由观察到的评级和用户真实偏好之间不一致性所引起的偏差,即嘈杂反馈或结果测量误差。本研究进一步提出了一种交叉威胁的观点,旨在解决从缺失非随机数据和有噪声数据中学习预测模型的问题,并通过实验证明了所提方法的有效性。
Jun, 2024
提出了一种元学习方法,受非对称三训练框架的启发,利用两个预测器生成可靠的伪评分数据和另一个预测器进行最终预测,以解决推荐系统中观察到的评分数据选择偏差问题,实现从有偏显式反馈中开发出有效的推荐。
Sep, 2019
本文提出了一种新的深度循环生存排序(DRSR)框架,以解决信息检索中的位置偏见问题,此框架利用循环神经网络模型上下文信息并综合采用生存分析和概率链规则来恢复一个用户各种行为的无偏联合概率,实现对用户的一系列行为进行关联建模。实验结果表明,相较于目前的一些模型,DRSR 能够显著提高性能。
Apr, 2020
我们提出了基于核的 DR 估计器,可以处理连续的处理方式,并通过充分性证明其正态形式是影响函数的一致近似。我们还提出了一种高效解决干扰函数的新方法,并以均方误差为指标进行了全面的收敛性分析,证明了我们估计器在合成数据集和实际应用中的实用性。
Sep, 2023