BriefGPT.xyz
大模型
Ask
alpha
关键词
propensity scoring
搜索结果 - 3
推荐因果效应的无偏学习
本论文提出了一种基于逆倾向评分技术的无偏学习框架,以解决推荐系统中的因果效应问题。通过构建无偏估计器和进行经验风险最小化,该框架可以有效地提高有限训练样本下的方差,从而开发出一种基于无偏学习方法的因果效应扩展排序度量方法。该方法在各种设置下
→
PDF
4 years ago
SIGIR
用于去偏差缺失非随机显式反馈的不对称三训练
提出了一种元学习方法,受非对称三训练框架的启发,利用两个预测器生成可靠的伪评分数据和另一个预测器进行最终预测,以解决推荐系统中观察到的评分数据选择偏差问题,实现从有偏显式反馈中开发出有效的推荐。
PDF
5 years ago
反事实风险最小化:从带状反馈中学习
开发了一种学习原则和一种有效算法,用于从记录的 bandit 反馈中进行批处理学习。由此产生的 Counterfactual Risk Minimization 原则提供了 POEM 的新学习方法,用于学习结构化输出预测的随机线性规则。
PDF
9 years ago
Prev
Next