一种面向信息检索的对抗性模仿点击模型

WWWApr, 2021

一种面向信息检索的对抗性模仿点击模型

An Adversarial Imitation Click Model for Information Retrieval

Xinyi Dai, Jianghao Lin, Weinan Zhang, Shuai Li, Weiwen Liu...

TL;DR本文提出了一种基于模仿学习的对抗学习点击模型框架（Adversarial Imitation Click Model, AICM），通过明确地学习恢复用户的内在效用和潜在意图的奖励函数，将用户与排名列表的交互建模为动态系统（而不是单步点击预测），通过对抗训练最小化 JS 发散来学习稳定的点击序列分布，从而将暴露偏差从 $O (T^2)$ 降到了 $O (T)$，结果表明 AICM 在传统点击度量和去暴露方面具有优异的性能。

Abstract

Modern information retrieval systems, including web search, ads placement, and recommender systems, typically rely on learning from user feedback. Click models, which study how users interact with a ranked list of items, provide a useful understanding of user feedback for learning ranking models. Constructing "right" dependencies is the key of any successful

click model probabilistic graphical models neural networks imitation learning adversarial training

发现论文，激发创造

Web 搜索中的图增强点击模型

本文提出了一种基于神经网络和图增强的点击模型 (GraphCM)，通过在构造的同质图中提取查询和文档之间的信息，分别对吸引力评估器和考试预测器进行建模，通过组合功能将考试概率和吸引力评分融合到点击预测中，综合实验结果表明其在处理数据稀疏性和冷启动问题方面具有优越性能。

Jun, 2022

半监督信息检索的对抗采样和训练

本文提出一种针对 ad-hoc 检索模型的数据不平衡及神经网络模型易受对抗干扰等问题的对抗性采样和训练框架，通过增强点击示例和获得非常信息化的非点击示例来学习 ad-hoc 检索模型，并在常见 ad-hoc 检索任务（如网络搜索，项目推荐和问答）的基准数据集上进行实验，结果表明该方法在高排名文档方面显着优于强基线，并且在使用仅占 5％的已标记数据对 IRGAN 在 NDCG@5 上实现更好的表现。

Nov, 2018

使用点击模型对排名策略进行离线评估

本文提出了一种评估算法来预测历史日志数据中排名列表上的点击数，并使用用户与项目列表的交互模型来构建统计效率更高的估计器。实验结果表明，相对于先前的估计器，该算法具有更高的性能表现。

Apr, 2018

DCM Bandits：多次点击学习排序

提出了一种 DCM Bandits 算法，用于利用线上学习来最大化推荐令人满意的网页，该算法是一种可行的、无遗憾的在线算法，用于学习在类似于级联点击模型中多次点击的排序问题。

Feb, 2016

基于级联模型的倾向性估计，用于反事实学习排序

本文提出了一种针对级联点击模式（CM）场景下的倾向性估计方法（CM-IPS），该方法在用户遵循 CM 点击搜索结果并具有极高表现的情况下，能使 CLTR 表现保持接近于全信息量表现，同时在用户遵循 PBM（Poisson Binomial Model）情况下，该方法不仅表现不佳，反而导致更大偏差，因此需要根据历史用户点击数据来选择使用 CM-IPS 或 PBM-based 倾向性估计方法。

May, 2020

随机化最小侵入式采集点击记录中的无偏好好处

通过处理搜索结果展示方式，消除展示偏见获取更客观的用户隐式反馈，取得更佳的排序效果。

May, 2006

点击率预测的决策环境交互网络

提出一种识别决策上下文交互网络，它可以显著地提高在线广告系统中的用户点击率预测。

Jan, 2023

评估大型语言模型的基于检索上下文学习的对抗鲁棒性

通过引入检索增强联系学习方法，利用检索器提取语义相关示例作为演示，提高模型对测试样本的攻击稳健性，并引入一种无需训练的对抗防御方法 DARD，通过丰富示例池来改进模型性能和稳健性。

May, 2024

具有偏差反馈的无偏学习排序

通过对因果推断框架的提出，使用倾向权重排序支持向量机从隐式反馈学习，消除了数据偏差问题，取得了更好的结果。

Aug, 2016

无偏的基于模型的交互式推荐

通过消除流行度偏差和采样偏差问题，我们提出了一种名为可识别去偏模型交互推荐（iDMIR）的模型，它基于因果机制的时间变化推荐生成过程，克服了现有模型的两个主要缺陷，并展示出优秀的推荐性能。

Feb, 2024