Hrishikesh Kulkarni, Sean MacAvaney, Nazli Goharian, Ophir Frieder
TL;DRLADR 是一种简单而有效的方法,通过利用词法检索技术来提高现有的密集检索模型的效率,同时不影响检索效果,建立了一种新的近似 k 最近邻技术的密集检索效率 - 效果 Pareto 边界。
Abstract
Retrieval approaches that score documents based on learned dense vectors
(i.e., dense retrieval) rather than lexical signals (i.e., conventional
retrieval) are increasingly popular. Their ability to identify rela
本文中介绍了 Deep Retrieval (DR) 算法,通过学习可检索结构来获取最优推荐结果,其编码所有候选项入离散潜在空间,接着使用当前模型下的光束搜索来检索前置候选项,以实现重新排名。实验证明,使用 DR 算法,在两个公共数据集上能够实现近乎于暴力基线的准确性,并且在实时生产推荐系统上,高度优化的 DR 算法显著优于 ANN 基准线。DR 是非 ANN 的推荐算法在工业推荐系统规模的首批成功部署之一。