Jul, 2024

语言模型在推荐系统中编码协同信号

TL;DR最近的研究表明,语言模型在语义之外还包含丰富的世界知识,这在各个领域引起了广泛关注。然而,在推荐领域中,目前尚不清楚语言模型是否隐含了用户偏好信息。本文反思了目前通行的理解,即由于语言和行为建模目标的巨大差距,语言模型和传统推荐模型学习的是两个不同的表示空间,探索从语言表示空间直接提取推荐表示空间。令人惊讶的是,我们的研究结果显示,当从先进的语言模型表示中进行线性映射得到的项目表示在推荐性能上超过了传统方法。这一结果表明,语言表示空间和有效的推荐表示空间之间存在同态性,暗示协同信号可能确实被编码在先进的语言模型中。在这些发现的基础上,我们提出了一种简单而有效的协同过滤模型AlphaRec,它利用项目的文本元数据(例如标题)的语言表示,而不是传统的基于ID的嵌入。具体而言,AlphaRec由三个主要组件组成:多层感知机(MLP)、图卷积和对比学习(CL)损失函数,使其非常易于实现和训练。我们的实证结果表明,AlphaRec在多个数据集上优于领先的基于ID的协同过滤模型,这是文本嵌入实现如此高性能的推荐器的首次案例。此外,AlphaRec引入了一种新的基于语言表示的协同过滤范式,具有多个优势:易于实现、轻量级、快速收敛、在新领域具有卓越的零-shot推荐能力,并且了解用户意图。