通过用户模拟评估对话式推荐系统
本书系统地回顾了用户模拟的研究进展,包括为设计用户模拟器制定的一般框架、利用用户模拟进行评估的模型和算法,以及用于搜索引擎、推荐系统和对话助手的用户交互模拟,并讨论了重要的未来研究方向。
Jun, 2023
通过五项任务评估语言模型在对话推荐中模拟人类行为的效果,研究发现基准模拟器的评估可以揭示语言模型与人类行为的差异,并提供了模型选择和提示策略的见解。
Mar, 2024
使用大型语言模型构建用户仿真器在对话推荐系统中存在一些限制和评估方法上的问题,因此提出了 SimpleUserSim 方法通过简单策略指导话题以显著提高推荐结果。
Mar, 2024
本文系统地回顾了当前对话式推荐系统(CRSs)的技术,总结了 CRSs 开发中的 5 个关键方向:基于问题的用户偏好获取、多轮对话推荐策略、对话理解和生成、开发利用折中和探索等方法的算法、以及 CRSs 的评估和用户模拟问题,并根据这些研究方向讨论了一些未来的挑战和机遇。
Jan, 2021
本文讨论了对话式推荐系统的评估方法,指出当前主要依赖离线计算度量方式可能存在不足,建议结合人类主观感受开展模型评价,以提高模型性能的准确性和有效性。
Sep, 2022
该研究论文介绍了用于电影预订领域的用户模拟器,它利用规则和收集到的数据,并支持电影票预订和电影寻找两个任务。为了实现对对话框架的经验算法比较,论文提出了一种新的模拟框架,展示了多个代理的思路,并详细介绍了将自己的代理添加到所提出的框架中进行测试的过程。
Dec, 2016
我们提出一种标准化用户模拟器构建的方法,用于评估对话系统质量。我们使用不同的对话规划和生成方法训练六个用户模拟器,并计算一组自动指标来评估这些模拟器的质量。此外,通过让人类用户评估模拟器并与训练系统交互,间接地和直接地评估了这些模拟器。本文提供了一个全面的用户模拟器研究评估框架,并更好地理解了不同用户模拟器的优缺点及其对训练系统的影响。
Sep, 2019