SIGIRApr, 2024

行为对齐:评估基于 LLM 的对话推荐系统的新视角

TL;DR基于大型语言模型的对话式推荐系统在行为一致性方面存在差异,本研究提出了行为一致性评估指标 Behavior Alignment,该指标通过与人类推荐者进行对比能够更好地衡量系统性能,并且提出了一种基于分类的隐式测量方法来评估该指标的鲁棒性。