大型语言模型不稳定的推荐系统
研究探讨了大语言模型在推荐系统中对流行度偏差的贡献和缓解的机会,并提出了一种新的测量流行度偏差的指标,通过对电影推荐任务的比较发现,即使没有明确的缓解方法,大语言模型推荐系统仍然表现出较少的流行度偏差。
Jun, 2024
本文概论了基于大型语言模型的推荐系统,提出了两种主要类型(分别为判别型 LLM 推荐 DLLM4Rec 和生成型 LLM 推荐 GLLM4Rec),分别从方法、技术和性能等方面对现有的 LLM 推荐系统进行了系统的分类和评估,并指出了主要挑战和有价值的发现。
May, 2023
大规模语言模型(LLMs)在重新塑造推荐系统中的重要性得到强调,将其价值归因于传统推荐系统中缺乏的独特推理能力。与缺乏直接用户交互数据的传统系统不同,LLMs 在推荐物品方面表现出卓越的熟练度,展示了其理解语言细微差别的能力,这标志着推荐领域的一个基本范式转变。在充满活力的研究领域中,研究人员积极利用 LLMs 的语言理解和生成能力重新定义推荐任务的基础。本文详细探讨了 LLMs 在推荐框架中的固有优势,包括细微的语境理解、在不同领域之间无缝切换、采用统一的方法、利用共享数据库的全面学习策略、透明的决策制定和迭代改进。尽管具有改变潜力,但仍存在挑战,包括对输入提示的敏感性、偶尔的误解以及意外的推荐,这需要对 LLM 驱动的推荐系统进行持续的完善和演进。
Feb, 2024
本文通过在线实验的方式,从用户的角度探讨了使用大型语言模型(LLMs)进行个性化电影推荐的有效性。研究结果显示,LLMs 提供较强的推荐解释能力,但缺乏整体个性化、多样性和用户信任。此外,不同的个性化提示技术对用户感知的推荐质量影响不大,而用户观看的电影数量起到了更重要的作用。与此同时,LLMs 展示了更好地推荐知名度较低或小众化电影的能力。通过定性分析,我们发现与用户交互体验中的积极和消极关联的关键对话模式,并得出结论:为了获得高质量的 LLMs 推荐,提供个人背景和示例至关重要。
Apr, 2024
最近,大型语言模型对推荐系统的进展起到了重要作用,但是在系统蓬勃发展的同时,推荐系统容易受到安全威胁,我们揭示了引入大型语言模型到推荐模型中会导致新的安全漏洞,并且证明了攻击者可以通过改变物品的文本内容来显著提高其曝光度,而不影响模型的训练过程,且攻击方法具有隐蔽性,难以被用户和平台检测到。我们通过对四种主流基于大型语言模型的推荐模型进行全面实验证明了我们方法的高效性和隐蔽性。我们的研究揭示了基于大型语言模型的推荐系统存在重大的安全漏洞,并为未来的保护这些系统的研究开辟了道路。
Feb, 2024
大型语言模型在自然语言处理领域取得了显著进展,在各种任务中展现出与人类语言相似的能力,为推荐系统中的应用提供了新的机会。本文具体研究了 LLM 增强推荐系统的样本效率,即模型在有限数量的训练数据下达到卓越性能的能力,并提出了 Laser 框架来验证大型语言模型能够提升推荐系统的样本效率。在两个公共数据集上进行的广泛实验表明,Laser 仅需少量训练样本就能达到甚至超越基于整个训练集训练的传统推荐模型,在样本效率上表现出优势。
Jun, 2024
近年来,大型语言模型在不同领域特别是自然语言处理和计算机视觉中得到广泛应用,推荐系统也出现了这种趋势。这篇综述论文从三个问题的角度探讨了基于大型语言模型的生成式推荐的进展、方法和未来方向:1)什么是生成式推荐,2)为什么推荐系统应该向生成式推荐发展,以及 3)如何为各种推荐系统任务实现基于大型语言模型的生成式推荐。希望这篇综述可以提供探索这一有趣且新兴话题所需的背景和指导。
Sep, 2023
本研究通过使用 SummEval 数据集进行一系列分析,证实了大型语言模型作为评估器在以下方面存在偏见和不一致性:(1)体现对低困惑度文本的偏好;(2)显示具有偏见的评分分布;(3)经历多属性判断时的锚定效应。此外,我们分享了配置大型语言模型评估器以减轻这些限制的方法,通过 RoSE 数据集的实验证明了与最先进的大型语言模型评估器相比的改进。
May, 2024
本文综述了基于应用方向的大语言模型在推荐系统中的应用,从‘何处’和‘如何’两方面总结了现有研究工作,并讨论了调整大语言模型到推荐系统中面临的关键挑战和未来前景。
Jun, 2023
此研究旨在探究大型语言模型在推荐系统中的排名能力,通过采用提示模板设计和引入特定策略,研究发现大型语言模型在候选物品的零 - shot 排名上有着很好的表现,但是若考虑历史互动的顺序、位移等因素,不同的提示和启发方法能够对大型语言模型的表现产生影响。
May, 2023