Mar, 2024

一个用于心理健康中大型语言模型的新颖细致对话评估框架

TL;DR我们提出了一个新颖的框架来评估大型语言模型(LLMs)的细致对话能力,将其应用于心理健康领域,并发现 GPT4 Turbo 在特定主题上表现出与经过验证的治疗师高度相关的成绩,从而帮助研究人员开发更好的 LLMs 以更积极地支持人们的生活。