WundtGPT: 塑造大型语言模型成为有同理心、积极主动的心理学家
本研究通过比较五款大型语言模型(LLMs)生成的相应和传统对话系统及人工生成的相应,发现 LLMs 在大多数情景中表现出更高的同理心,从而探索并验证 LLMs 在模拟心理咨询对话中生成同理心回应的能力。
Oct, 2023
大型语言模型(LLMs)在医疗领域的整合潜在地可以通过开发具有共情能力,面向患者的聊天机器人,显著增强患者护理和支持。本研究调查了一个有趣的问题:相较于通常由医生提供的,ChatGPT 能否提供更高程度的共情回应?为了回答这个问题,我们从梅奥诊所收集了病人信息和医生回复的去标识化数据集,并使用 ChatGPT 生成了备选回复。我们的分析包括了一种新的共情评级(EMRank)评估方法,评估回复的共情程度,该方法涵盖了自动化指标和人工评估。我们的研究结果表明,由 LLM 驱动的聊天机器人在传递共情沟通方面有超过人类医生的潜力,这为增强患者护理和减少专业倦怠提供了有前景的途径。本研究不仅强调了患者互动中共情的重要性,还提出了一套有效的自动共情评级指标,为 LLM 在医疗领域更广泛的应用铺平了道路。
May, 2024
大型语言模型在培养有同理心的对话、构建和谐社会关系以及发展有帮助的人工智能方面具有至关重要的作用。本研究通过实证调查了大型语言模型在生成有同理心的回应方面的性能,并提出了三种改进方法:语义上下文学习、两阶段交互生成和与知识库的结合。广泛的实验证明,我们的方法能够显著改善大型语言模型的性能,在自动评估和人工评估方面达到最先进的水平。此外,我们还探索了 GPT-4 模型模拟人工评估者的可能性。
Oct, 2023
大型语言模型(LLMs)在许多任务中表现出了令人惊讶的性能,包括撰写表达共情的支持性信息。我们在这里让这些模型生成对描述常见生活经历的帖子的共情信息,例如职场环境、育儿、人际关系和其他引发焦虑和愤怒的情境。通过两项研究(N=192,202),我们向人类评估者展示了几个模型(GPT4 Turbo、Llama2 和 Mistral)生成的各种回应,并要求他们评估这些回应的共情程度。我们发现 LLM 生成的回应在共情程度上一直被评为比人工撰写的回应更具共情性。语言分析还表明,这些模型在标点符号、表情符号和某些词语的使用方面具有独特、可预测的 “风格”。这些结果凸显了在强调共情的情境中利用 LLMs 提升人类同伴支持的潜力。
Mar, 2024
通过使用心理学实践中的认知重评方式,本研究设计出一种具有高级心理能力的大型语言模型,经过专家评估证实,即使是由 RESORT 引导的规模为 7B 的大型语言模型也能够生成能够帮助用户认知重评自身情况的共情回应。
Apr, 2024
本研究通过与人类基准对比的方式,综合评估了四个最先进的大型语言模型(GPT-4、LLaMA-2、Mixtral-8x7B 和 Gemini-Pro)在共 2000 个情感对话提示中的回应中的移情能力。我们的发现显示,大型语言模型在移情回应能力上显著超过人类,其中 GPT-4 的回应被评为 “好” 的比例比人类基准提高了约 31%。此外,我们发现不同的大型语言模型在回应不同情感时表现显著不同。基于研究结果,我们提出了一种可扩展和可适应的评估框架,用于评估新大型语言模型的移情能力,避免了未来研究中重复这项研究的需求。
Jun, 2024
本文探讨了大型语言模型在心理咨询中的应用,通过专用提示信息来提高其在提供共情、相关和支持性回应方面的性能,研究结果表明我们的训练模型优于几个基线模型,凸显其作为可扩展且易于获取的心理健康支持工具的潜力。
Jun, 2024
评估大型语言模型在理解人类心理健康状况表达方面的潜力,结果显示,基于 Transformer 的模型(如 BERT 和 XLNet)在 DAIC-WOZ 数据集上表现优于大型语言模型。
Jan, 2024
我们提出了一个新颖的框架来评估大型语言模型(LLMs)的细致对话能力,将其应用于心理健康领域,并发现 GPT4 Turbo 在特定主题上表现出与经过验证的治疗师高度相关的成绩,从而帮助研究人员开发更好的 LLMs 以更积极地支持人们的生活。
Mar, 2024
通过将大规模语言模型(LLM)整合到工作流程中,我们旨在解决临床人力短缺在精神保健中所面临的挑战,从而为一般人群提供公平的精神保健。虽然 LLMs 在临床决策方面已经展示了其能力,但它们在创伤后应激障碍(PTSD)等严重疾病适应方面尚未得到充分探索。因此,我们收集了 411 个临床医师进行的诊断性访谈,并设计了一种获得高质量数据的新方法。此外,我们构建了一个综合框架,通过利用两个最先进的 LLMs(GPT-4 和 Llama-2)来自动完成基于访谈内容的 PTSD 诊断评估,这具有更广泛的临床诊断潜力。我们的结果在我们的数据集上展示了 LLMs 有望协助临床医生进行诊断验证的强大潜力。据我们所知,这是第一个完全基于临床医师访谈进行心理疾病评估自动化的人工智能系统。
May, 2024