基于系统和用户角度的对话推荐系统评估协议

Apr, 2024

基于系统和用户角度的对话推荐系统评估协议

Concept -- An Evaluation Protocol on Conversation Recommender Systems with System- and User-centric Factors

Chen Huang, Peixin Qin, Yang Deng, Wenqiang Lei, Jiancheng Lv...

TL;DR当前的对话推荐系统 (CRS) 在现实场景中的用户体验遭受批评，尽管在学术界取得了显著进展。存在着针对 CRS 的评估协议可能偏重系统中心因素，如对话的效果和流畅性，而忽视了用户中心的方面。因此，我们提出了一个新的全面的评估协议 Concept，将系统中心和用户中心因素进行整合。通过概括三个关键特性以及将它们划分为六个主要能力，来实施 Concept。为了实现 Concept，我们采用了基于 LLM 的用户模拟器和评估器，并为每个主要能力定制了评分标准。我们的协议 Concept 有两个目的。首先，它提供了当前 CRS 模型中优点和缺点的概述。其次，它指出了 “无所不能” 的 ChatGPT 中可用性问题，并为评估 CRS 提供了全面的参考指南，从而为 CRS 的改进奠定了基础。

Abstract

The conversational recommendation system (CRS) has been criticized regarding its user experience in real-world scenarios, despite recent significant progress achieved in academia. Existing evaluation protocols fo

conversational recommendation system evaluation protocol user experience llm-based user simulator crs improvement

发现论文，激发创造

INFACT: 一种用于对话推荐的在线人类评估框架

本文讨论了对话式推荐系统的评估方法，指出当前主要依赖离线计算度量方式可能存在不足，建议结合人类主观感受开展模型评价，以提高模型性能的准确性和有效性。

Sep, 2022

定制化对话推荐系统

本文提出了定制化对话推荐系统（CCRS）的概念，以提高用户体验，包括多样化的对话回复生成器和细粒度意向识别，并通过元学习的方法定制化模型参数，实验表明 CCRS 在推荐和对话服务方面具有优越性。

Jun, 2022

对话式推荐系统调查

本文详细调查了面向会话的推荐技术现有的方法，将这些方法按支持的用户意向或背景知识等维度分类，同时讨论了技术方法、CRS 的评估，以及未来需要更多研究的领域。

Apr, 2020

对话式推荐系统的进展与挑战：综述

本文系统地回顾了当前对话式推荐系统（CRSs）的技术，总结了 CRSs 开发中的 5 个关键方向：基于问题的用户偏好获取、多轮对话推荐策略、对话理解和生成、开发利用折中和探索等方法的算法、以及 CRSs 的评估和用户模拟问题，并根据这些研究方向讨论了一些未来的挑战和机遇。

Jan, 2021

BARCOR: 面向会话推荐系统的统一框架

本文提出了一种基于 BART 的统一框架，针对面向对话推荐的两个任务（推荐和响应生成）设计了单一模型，另外还构建了一个电影领域的轻量级知识图谱，在自动化和人类评估方面都取得了最先进的表现。

Mar, 2022

以语言处理任务为基础的参数高效对话推荐系统

使用预先训练的语言模型以自然语言表示项，通过语义匹配进行项目推荐和对话生成的统一模型 PECRS，在两个基准数据集上的实验证明了其在推荐和对话方面的有效性。

Jan, 2024

多维用户建模的用户中心对话推荐

本文提出了一种基于用户中心的对话推荐模型，该模型利用了用户历史对话记录和类似用户的信息作为用户偏好的重要来源，在对话生成和推荐方面表现出了优越性。

Apr, 2022

当前基于 LLM 的对话推荐用户模拟器的局限性分析

使用大型语言模型构建用户仿真器在对话推荐系统中存在一些限制和评估方法上的问题，因此提出了 SimpleUserSim 方法通过简单策略指导话题以显著提高推荐结果。

Mar, 2024

通过用户模拟评估对话式推荐系统

本文提出一种通过用户模拟来替代人类评估的方法，以实现对话推荐系统的自动评估。作者表明，通过考虑用户的个人喜好和与系统的一般交互流程，偏好建模和特定任务交互模型都有助于实现高度自动化的绩效评估结果和人工人工评估的高度相关性。

Jun, 2020

通过上下文和时态建模改进对话推荐系统，减少领域特定知识

该论文探讨了从上下文中提取内部知识来进行个性化推荐的方法，包括实体级别和上下文级别的表示，以及一个时间感知关注机制和使用预训练的 BART 模型来初始化生成模块，结果表明这种方法在多种数据集上的表现优于使用更多外部领域特定知识的方法，并且具有诸多优点和适用场景。

Sep, 2022