Oct, 2024

大型语言模型是否符合核心心理健康咨询能力?

TL;DR本研究针对大型语言模型(LLMs)与心理健康咨询核心能力之间的缺乏对齐进行了探讨,提出了CounselingBench这一新型基准,评估22种通用及医学微调的LLMs在五项关键心理健康咨询能力上的表现。研究发现,虽然前沿模型达到了基本要求,但未能达到专家水平,特别是在同情心和情境理解等能力方面存在显著不足,因此亟需开发与心理健康咨询能力相匹配的专用模型。