关键词online learning to rank
搜索结果 - 7
- 基于位置的点击模型的强盗学习排序:个性化和均等待遇
提出了第一个通用 MAB 框架来捕捉在线学习排序(ONL2R)和基于位置点击模型的所有关键要素,并开发了基于贪婪和 UCB 算法的统一策略(GreedyRank 和 UCBRank),分别适用于个性化和相等的排序处理,证明了这两个算法在不同 - 基于随机点击模型的在线学习排序的对抗攻击
本文提出针对在线学习排名的对抗攻击研究,依托排名列表污染来攻击 OLTR 算法,实验结果验证了该攻击策略的有效性和成本效益。
- 利用点击反馈对在线学习排序进行对抗攻击
本文研究了攻击多个 OLTR 变体的策略,并提出了一般的攻击策略来攻击任何算法,在合成数据和真实数据上的实验验证了我们提出的攻击算法的有效性。
- SIGIR在线学习排序的梯度探索方差减小
提出了在线学习排名中梯度估计的降低方差方法,通过在当前查询下的已检查文档的特征向量所组成的 “文档空间” 中进行方向投影,可以减少梯度估计的高方差,进而改善模型估计的效果。
- 在线环境中的排名模型优化
本文介绍了在线学习排序的两种最新方法:Dueling Bandit Gradient Descent(DBGD)和 Pairwise Differentiable Gradient Descent(PDGD)的比较及其在极端嘈杂和非连锁用户 - 可微的无偏在线学习排名
Pairwise Differentiable Gradient Descent (PDGD) is an efficient and unbiased Online Learning to Rank approach that allow - 信息检索中在线学习排序平衡速度和质量
该研究的目的是通过与用户互动来找到一个最优的排名模型。然而,复杂的模型需要更多的用户互动,简单的模型则会收敛于次优解。通过开发一个名为 Sim-MGD 的快速 OLTR 模型以及使用级联多叶梯度下降的新方法 C-MGD,研究人员成功地平衡了