文章提出采用反事实风险最小化法(CRM)来实现从真实世界的日志数据中学习排名模型,以避免需要有关性的判断和数据聚合,此方法更适合从 Logged 数据中学习,CRM 方法有效地从 Logged 数据中学习,效果显著优于基线排名器(λ-MART),并且优于各种深度神经网络模型的全信息损失(例如交叉熵)的表现。
Jul, 2019
该论文提出了一个基于 CAS 模型的用户行为模型,能更精确地预测用户行为并计算搜索引擎结果页的效用,减轻了特定元素对点击率和用户注意力的负面影响,更加符合用户反馈。
Sep, 2016
在电子商务搜索中,通过利用历史查询重构日志,采用远程监控的方法来确定查询的产品意图,进而在搜索引擎中强调定义查询的产品意图的术语,从而改善排名。实验证明比非情境性基线更胜一筹,可以解决查询处理中出现的多种问题。
Aug, 2019
本研究旨在通过用户点击喜欢和不喜欢的搜索结果提供反馈,以指导搜索过程,构建了新的基于时尚领域大规模数据集的点击反馈检索基准,证明了将点击反馈纳入训练可以显著提高检索质量。
Apr, 2023
通过开发深度学习模型来识别搜索中的信息不匹配,可以显著提高电商用户体验和排名性能。
May, 2020
研究搜索引擎结果页面和其中的要素对点击率和网站流量的影响,揭示 SERP 特征不仅是美学组成部分,还能强烈影响用户行为。通过模拟点击率,演示了这些要素的逐步预测能力。
May, 2023
该研究提出了一种叫做 ETA 的局部敏感哈希方法,可以大大降低训练和推理成本,并使得可以使用长期用户行为序列进行端到端训练,以实现更好的点击率预测表现。
Aug, 2021
本文系统地回顾了 CTR 预测领域的最新研究进展及其建模框架,着重介绍了基础建模框架及其拓展,对其优缺点和预测性能进行了分类总结,并结合各类数据集对不同复杂度和要素相互作用顺序进行了性能比较。同时,本文还识别出当前研究趋势、主要挑战和未来研究方向,为有意从事该领域的学者提供了基础知识和高效的进入点。
Feb, 2022
本文提出了一种评估算法来预测历史日志数据中排名列表上的点击数,并使用用户与项目列表的交互模型来构建统计效率更高的估计器。实验结果表明,相对于先前的估计器,该算法具有更高的性能表现。
Apr, 2018
本文提出了利用基于自我注意力的神经网络的机器理解方法,来解决电子商务对话搜索中的查询跟踪问题,并构建了一种新的数据集,实验结果表明,该模型在精确匹配度和 F1 得分方面优于几种基线模型,展示了机器理解模型在此任务上的潜力。
Oct, 2018