基于生成检索的推荐系统

May, 2023

Recommender Systems with Generative Retrieval

Shashank Rajput, Nikhil Mehta, Anima Singh, Raghunandan H. Keshavan, Trung Vu...

TL;DR提出一种新颖的单阶段生成检索模型，将 Amazon 数据集用于训练，结果表明，这种模型能够获得更好的推荐效果和更好的泛化能力以推荐 “冷启动” 物品。

Abstract

Modern recommender systems leverage large-scale retrieval models consisting of two stages: training a dual-encoder model to embed queries and candidates in the same space, followed by an Approximate Nearest Neighbor (ANN) search to select top candidates given a query's embedding. In th

recommender systems generative retrieval model semantic ids rq-vae sequence-to-sequence model

发现论文，激发创造

用于重新排序推荐的非自回归生成模型

在多阶段推荐系统中，重新排名通过建模项之间的内部列表相关性发挥着关键作用。在重新排名中的关键挑战在于在排列组合空间中探索最优序列。最近的研究提出了一个生成器 - 评估器学习范式，其中生成器生成多个可行序列，评估器基于估计的列表得分选择出最佳序列。生成器是至关重要的，而生成模型非常适合生成器函数。然而，在实时工业系统中部署自回归模型是具有挑战性的。因此，我们提出了一种用于重新排名推荐的非自回归生成模型 (NAR4Rec)，旨在提高效率和效果。为了解决与稀疏训练样本和动态候选项对模型收敛的影响相关的挑战，我们引入了匹配模型。考虑到用户反馈的多样性，我们提出了一种序列级别的非可能性训练目标，以区分可行序列和不可行序列。此外，为了克服非自回归模型中关于目标项的依赖建模不足的问题，我们引入了对比解码来捕捉这些项之间的相关性。对公开可用数据集进行的大量离线实验验证了我们所提出方法与现有最先进的重新排名方法相比的卓越性能。此外，我们的方法已在拥有超过 3 亿日活跃用户的热门视频应用快手上完全部署，显著提高了在线推荐的质量，展示了我们方法的有效性和效率。

Feb, 2024

语义 ID 提高泛化能力：推荐排名案例研究

该论文通过使用基于 RQ-VAE 的语义 ID 替代随机生成 ID 的方式来解决推荐系统中的冷启动问题，并展示了语义 ID 对模型的泛化能力的提升。

Jun, 2023

上下文生成检索

提出了一种上下文生成检索模型，其在生成式检索模型的解码步骤中使用上下文嵌入，结合了双编码器方法和生成式检索模型的优点，显示出比只有普通嵌入的情况更高的性能。

Oct, 2022

面向生成推荐的个性化提示模型检索

利用生成模型进行推荐系统和个性化问题的初步研究，提出了 Prompt-Model 检索和生成项排序的两阶段框架，并通过 GEMRec-18K 数据集展示了生成模型推荐的潜力和现有评估指标的局限性。

Aug, 2023

深度检索：学习大规模推荐系统的可检索结构

本文中介绍了 Deep Retrieval (DR) 算法，通过学习可检索结构来获取最优推荐结果，其编码所有候选项入离散潜在空间，接着使用当前模型下的光束搜索来检索前置候选项，以实现重新排名。实验证明，使用 DR 算法，在两个公共数据集上能够实现近乎于暴力基线的准确性，并且在实时生产推荐系统上，高度优化的 DR 算法显著优于 ANN 基准线。DR 是非 ANN 的推荐算法在工业推荐系统规模的首批成功部署之一。

Jul, 2020

自回归实体检索

GENRE 是第一个通过自回归方式逐个 token 生成实体名称以检索实体的系统，此方法可以在自动编码器中直接捕捉上下文和实体名称之间的关系，从而减少内存占用并提高检索效率。

Oct, 2020

生成式检索作为多向量密集检索

生成检索是使用序列到序列架构，以端到端的方式为给定查询生成相关文档标识符的方法。本文通过研究生成检索的注意力层和预测头，揭示了生成检索与多向量稠密检索在测量文档对查询的相关性时采用相同的框架，并通过实验证明了这些方法在对齐矩阵中的术语匹配上具有相似性。

Mar, 2024

用于生成上下文感知查询建议的层次递归编码器 - 解码器

本文提出了一种基于概率模型的搜索建议方法，使用新颖的分层递归编解码器架构，能够考虑任意长度的查询序列，实现上下文感知，解决数据稀疏问题，在下一个查询预测任务中优于现有上下文感知方法，并且可以用于许多其他应用。

Jul, 2015

一种端到端生成式检索方法用于赞助搜索引擎 -- 高效解码到封闭目标领域

本篇论文提出了一种使用神经机器翻译方法来直接从查询中生成关键字的检索方法，并采用基于 Trie 的修剪技术来解决目标空间为限制闭合集合的检索环境下的关键字生成问题。该方法被应用于百度商业搜索引擎作为辅助检索分支，使得收益提升 10% 以上。

Feb, 2019

生成与检索：利用预测提高语义解析的检索效果

提供一种新的叫做 GandR 的语义解析模型，可提高在低资源语境下的解析准确度，该模型使用具有相似输出的样本作为依据，超越了现有语义解析技术。

Sep, 2022