利用大型语言模型开发了一种新的会话式推荐系统(LLMCRS),能够有效管理子任务、解决不同的子任务、并生成与用户交互的响应,通过细化工作流程和使用强化学习的反馈优化,实验结果表明其性能超过现有方法。
Aug, 2023
我们提出了一种包含多个模块的多智能体对话推荐系统 (MACRS),该系统可以通过控制对话流动以及利用用户反馈来改进推荐性能,并展示了在推荐和用户偏好收集方面相较于直接使用大型语言模型 (LLMs) 的用户交互体验的改进。
Feb, 2024
使用大型语言模型构建用户仿真器在对话推荐系统中存在一些限制和评估方法上的问题,因此提出了 SimpleUserSim 方法通过简单策略指导话题以显著提高推荐结果。
Mar, 2024
本文研究了将大型语言模型与对话型推荐系统结合在电子商务售前对话中的有效性,并提出了两种协作方法:对话型推荐系统辅助大型语言模型和大型语言模型辅助对话型推荐系统。通过对真实世界电子商务售前对话数据集进行广泛实验,我们分析了两种协作方法在四个任务上对电子商务售前对话的影响,发现 CRS 和 LLM 之间的协作在某些情况下非常有效。
Oct, 2023
我们介绍了一种可控、可扩展和人工参与的用户模拟器框架 (CSHI),通过插件管理器管理用户模拟器的行为,以提供更真实和令人信服的用户交互体验,并通过实验证明我们的框架能够适应各种对话推荐设置并有效地模拟用户的个性化偏好,从而促进对现有 CRS 研究的可靠评估和高质量对话推荐数据集的创建。
May, 2024
本文综述了基于应用方向的大语言模型在推荐系统中的应用,从‘何处’和‘如何’两方面总结了现有研究工作,并讨论了调整大语言模型到推荐系统中面临的关键挑战和未来前景。
Jun, 2023
大型语言模型在自然语言处理领域取得了显著进展,在各种任务中展现出与人类语言相似的能力,为推荐系统中的应用提供了新的机会。本文具体研究了 LLM 增强推荐系统的样本效率,即模型在有限数量的训练数据下达到卓越性能的能力,并提出了 Laser 框架来验证大型语言模型能够提升推荐系统的样本效率。在两个公共数据集上进行的广泛实验表明,Laser 仅需少量训练样本就能达到甚至超越基于整个训练集训练的传统推荐模型,在样本效率上表现出优势。
Jun, 2024
本文旨在高效地使大型语言模型在会话推荐系统任务中使用外部知识和目标引导。通过对先进的大型语言模型在特定领域的会话推荐系统任务中的局限性进行综合评估,我们发现外部知识和目标引导对于推荐准确性和语言质量有显著的贡献。基于这一发现,我们提出了一种新颖的 ChatCRS 框架,通过实现知识检索代理和目标规划代理,将复杂的会话推荐系统任务分解为多个子任务。在两个多目标会话推荐系统数据集上的实验结果表明,ChatCRS 建立了新的最先进基准,将信息的语言质量提高了 17%,主动性提高了 27%,并且推荐准确性提升了十倍。
本文通过在线实验的方式,从用户的角度探讨了使用大型语言模型(LLMs)进行个性化电影推荐的有效性。研究结果显示,LLMs 提供较强的推荐解释能力,但缺乏整体个性化、多样性和用户信任。此外,不同的个性化提示技术对用户感知的推荐质量影响不大,而用户观看的电影数量起到了更重要的作用。与此同时,LLMs 展示了更好地推荐知名度较低或小众化电影的能力。通过定性分析,我们发现与用户交互体验中的积极和消极关联的关键对话模式,并得出结论:为了获得高质量的 LLMs 推荐,提供个人背景和示例至关重要。
Apr, 2024
本文介绍了利用大型语言模型进行对话推荐的研究,并提出了一种基于 LLM 的用户模拟器的交互式评估方法 iEvaLM,从而改善了现有的评估协议。在两个公共数据集上的实验表明,ChatGPT 展现出较大的优势,并强调解释性的评估。此研究有助于更深入地理解 LLMs 在 CRSs 中的潜力,并为未来的研究提供一个更灵活、易于使用的评估框架。
May, 2023