Aug, 2023

从负面用户反馈学习和衡量顺序推荐器的响应性

TL;DR我们将负面用户反馈引入了序列推荐器的训练目标中,在检索阶段使用一种 “不推荐” 的损失函数来优化不推荐带有负面反馈的项目的对数似然。我们通过在大规模工业推荐系统上进行实时实验来证明了这种方法的有效性。此外,我们通过开发一个对照模拟框架来衡量推荐器对负面反馈的响应能力,展示了建模变化带来的响应能力改进。