大型语言模型作为推荐系统:流行偏见的研究
大规模语言模型(LLMs)在重新塑造推荐系统中的重要性得到强调,将其价值归因于传统推荐系统中缺乏的独特推理能力。与缺乏直接用户交互数据的传统系统不同,LLMs 在推荐物品方面表现出卓越的熟练度,展示了其理解语言细微差别的能力,这标志着推荐领域的一个基本范式转变。在充满活力的研究领域中,研究人员积极利用 LLMs 的语言理解和生成能力重新定义推荐任务的基础。本文详细探讨了 LLMs 在推荐框架中的固有优势,包括细微的语境理解、在不同领域之间无缝切换、采用统一的方法、利用共享数据库的全面学习策略、透明的决策制定和迭代改进。尽管具有改变潜力,但仍存在挑战,包括对输入提示的敏感性、偶尔的误解以及意外的推荐,这需要对 LLM 驱动的推荐系统进行持续的完善和演进。
Feb, 2024
本文概论了基于大型语言模型的推荐系统,提出了两种主要类型(分别为判别型 LLM 推荐 DLLM4Rec 和生成型 LLM 推荐 GLLM4Rec),分别从方法、技术和性能等方面对现有的 LLM 推荐系统进行了系统的分类和评估,并指出了主要挑战和有价值的发现。
May, 2023
本文通过在线实验的方式,从用户的角度探讨了使用大型语言模型(LLMs)进行个性化电影推荐的有效性。研究结果显示,LLMs 提供较强的推荐解释能力,但缺乏整体个性化、多样性和用户信任。此外,不同的个性化提示技术对用户感知的推荐质量影响不大,而用户观看的电影数量起到了更重要的作用。与此同时,LLMs 展示了更好地推荐知名度较低或小众化电影的能力。通过定性分析,我们发现与用户交互体验中的积极和消极关联的关键对话模式,并得出结论:为了获得高质量的 LLMs 推荐,提供个人背景和示例至关重要。
Apr, 2024
通过探索性研究,我们发现 LLMs 中的位置偏差会影响推荐系统的性能,因此我们提出了一个贝叶斯概率框架来校准 LLMs 的不稳定性,并增强推荐性能,实验证明了框架的有效性。
Dec, 2023
传统的推荐系统利用用户对项目的偏好历史记录来推荐新内容,而现代对话界面则提供了一种基于语言偏好表达的基本不同模式。本文研究了大型语言模型 (LLM) 的提示范式在使用基于项目和语言偏好的推荐中与最先进的基于项目的协同过滤 (CF) 方法相比的应用。通过收集既包含基于项目偏好又包含基于语言偏好的新数据集,以及用户对多种(有偏见的)推荐项目和(无偏见的)随机项目的评分,支持了这一调查。在众多实验结果中,我们发现对于纯语言偏好(无项目偏好)的情况,LLM 在近乎冷启动的情况下与基于项目的 CF 方法相比提供了有竞争力的推荐性能,尽管其在这个特定任务上没有进行监督训练(零射击)或只有少数标签(少射击)。这一点尤其令人鼓舞,因为基于语言偏好的表示比基于项目或基于向量的表示更加可解释和可审查。
Jul, 2023
通过分析工作推荐,揭示大型语言模型中的人口统计偏见。研究发现 LLMs 存在与不同人口统计身份相关的偏见,如 Mexican workers 普遍倾向于低薪工作,女性倾向于秘书角色。这突出了在后续应用中量化 LLMs 偏见的重要性,以了解可能造成的伤害和不公平结果。
Aug, 2023
大型语言模型中的社会偏见评估和缓解技术的综述,介绍了社会偏见与公平的概念、评估指标和数据集,以及介绍了干预方法的分类和研究趋势,帮助研究人员和实践者更好地理解和防止偏见在大型语言模型中的传播。
Sep, 2023
近年来,大型语言模型在不同领域特别是自然语言处理和计算机视觉中得到广泛应用,推荐系统也出现了这种趋势。这篇综述论文从三个问题的角度探讨了基于大型语言模型的生成式推荐的进展、方法和未来方向:1)什么是生成式推荐,2)为什么推荐系统应该向生成式推荐发展,以及 3)如何为各种推荐系统任务实现基于大型语言模型的生成式推荐。希望这篇综述可以提供探索这一有趣且新兴话题所需的背景和指导。
Sep, 2023