WWWApr, 2021

一种面向信息检索的对抗性模仿点击模型

TL;DR本文提出了一种基于模仿学习的对抗学习点击模型框架(Adversarial Imitation Click Model, AICM),通过明确地学习恢复用户的内在效用和潜在意图的奖励函数,将用户与排名列表的交互建模为动态系统(而不是单步点击预测),通过对抗训练最小化 JS 发散来学习稳定的点击序列分布,从而将暴露偏差从 $O (T^2)$ 降到了 $O (T)$,结果表明 AICM 在传统点击度量和去暴露方面具有优异的性能。