本文介绍了一种名为 RecSim NG 的概率化平台,用于模拟多智能体交互的建议系统,并演示了如何使用它来生成可配置的模型,以帮助研究人员和从业者轻松地开发和训练新的算法。
Mar, 2021
本篇研究利用仿真器训练上下文感知策略来处理 Long-term user engagement 优化中的现实间隙问题,该策略能够在模拟器和真实环境中学习和识别用户行为模式,并在不同环境下作出最佳决策,实验结果表明 Sim2Rec 模型在模拟环境和真实环境中均可以有效推荐。
May, 2023
本文介绍了一种基于大型语言模型的推荐系统模拟器 RecAgent,旨在克服仿真研究的缺陷并突出优势,通过真实用户行为来验证其有效性。
Jun, 2023
我们介绍了一种可控、可扩展和人工参与的用户模拟器框架 (CSHI),通过插件管理器管理用户模拟器的行为,以提供更真实和令人信服的用户交互体验,并通过实验证明我们的框架能够适应各种对话推荐设置并有效地模拟用户的个性化偏好,从而促进对现有 CRS 研究的可靠评估和高质量对话推荐数据集的创建。
May, 2024
本研究介绍 RL4RS 数据集和评估框架,用于缓解强化学习型推荐系统中现有数据集真实性不足的问题。该数据集包含两个真实世界数据集、仿真环境以及基准模型等,可用于增强强化学习应用于推荐系统的可靠性。
Oct, 2021
EasyRL4Rec 是一种面向基于强化学习推荐系统的用户友好且高效的库,具有轻量级、多样化的强化学习环境,详细的核心模块以及与推荐系统相适应的定制解决方案,旨在促进强化学习推荐系统领域的模型开发和实验过程。
Feb, 2024
本文介绍了一种基于生成对抗网络的用户模拟器,可以用于预先训练和评估新的基于强化学习的推荐算法,并使用真实世界的电子商务数据进行实验验证。
Jun, 2019
本文提出一种通过用户模拟来替代人类评估的方法,以实现对话推荐系统的自动评估。作者表明,通过考虑用户的个人喜好和与系统的一般交互流程,偏好建模和特定任务交互模型都有助于实现高度自动化的绩效评估结果和人工人工评估的高度相关性。
Jun, 2020
通过综合和多学科的调查研究,本文连接了使用生成模型(Gen-RecSys)在推荐系统中的关键进展,包括:基于交互驱动生成模型的基础概述;大型语言模型(LLM)用于生成推荐、检索和对话推荐的应用;以及用于处理和生成图像和视频内容的多模态模型在推荐系统中的整合。我们的全面观点使我们能够突出评估 Gen-RecSys 的影响和风险所必需的范式,并确定开放挑战。有关论文的更加最新版本可在此 https URL 找到。
Mar, 2024
本文对基于强化学习的推荐系统进行了综述,提出了一个 RLRS 框架,包括状态表示,策略优化,奖励制定和环境构建,并针对 RLRS 算法进行了调查,强调出现的主题并展示了各种图表。
Jan, 2021