Jun, 2024

ESC-Eval:评估大型语言模型中的情感支持对话

TL;DR人类情感支持对话(ESC)是一个重要应用,旨在减轻人类压力,提供情感指导,最终增强人类的心理和身体健康。本研究提出了一个 ESC 评估框架(ESC-Eval),利用角色扮演代理与 ESC 模型交互,并通过手动评估交互对话,对基于大型语言模型(LLMs)的 ESC 模型进行评估。实验结果表明,面向 ESC 的 LLMs 相较于通用 AI 助手 LLMs 表现出更具优越的 ESC 能力,但仍存在与人类表现之间的差距。