通过大型语言模型理解心理健康的评估
全球精神健康危机,人工智能和大型语言模型能够支持或提供心理咨询,但其应用也引发了准确性、有效性、可靠性的担忧。本文研究了大型语言模型在心理咨询中面临的主要挑战,包括模型错觉、可解释性、偏见、隐私和临床有效性,并探讨了解决这些挑战的潜在方案,以改进心理健康护理。
Nov, 2023
总结和概括了大型语言模型(LLMs)在心理健康领域的应用,包括早期筛查、数字干预和其他临床应用领域的强项、限制、挑战和机遇,并指出了 LLMs 在心理健康问题检测和个性化医疗方面的有效性,同时也提出了关于文本一致性、幻觉内容和缺乏伦理框架的风险以及 LLMs 作为创新临床工具的进一步研究和发展的必要性,强调 LLMs 应该是专业心理健康服务的补充而非替代。
Feb, 2024
全球心理健康问题的比例正在上升,现有的心理卫生模型已无法满足需求;大型语言模型 (LLMs) 的出现给人们带来了巨大的希望,有望创造新颖的、大规模的解决方案来支持心理健康。在这篇综述中,我们总结了现有文献关于使用 LLMs 提供心理健康教育、评估和干预的研究,重点强调了每个领域中的机遇。我们还强调了 LLMs 应用于心理健康所面临的风险,并鼓励采取策略来减轻这些风险。急需提供心理健康支持的紧迫性必须与负责任的心理健康 LLMs 的开发、测试和部署相平衡。特别重要的是,确保心理健康 LLMs 针对心理健康进行优化,增加心理健康公平性,遵守伦理标准,并确保人们,包括那些有心理健康问题经验的人,在从开发到部署的各个阶段都参与其中。优先考虑这些努力将减少对心理健康的潜在伤害,并最大程度上确保 LLMs 对全球心理健康产生积极影响。
Mar, 2024
大型语言模型的进展展示了在各个应用领域的强大能力,包括心理健康分析。然而,现有的研究着重于预测性能,对公平性这一关键问题的探讨不足,给弱势人群带来了重大风险。我们通过针对八个不同的心理健康数据集,使用十种不同的提示方法,系统地评估了七个社会因素的偏见。结果表明,GPT-4 在性能和公平性方面实现了最佳的平衡,尽管在某些情况下仍落后于领域特定模型如 MentalRoBERTa。此外,我们针对公平性进行调整的提示方法可以有效减轻在心理健康预测中的偏见,凸显了在该领域进行公平分析的巨大潜力。
Jun, 2024
近年来,大型语言模型(LLM)在数字精神健康工具设计、开发和实施领域展示了潜在的机遇和风险,我们提出了四个应用领域,包括对需要关怀的个体的求助行为、社区关怀提供、机构和医疗关怀提供,以及更大规模的社会关怀生态系统,并思考了 LLM 技术如何提升心理健康。本文的发现有助于未来研究、倡导和监管工作,以创建更负责任、用户友好、公平和安全的基于 LLM 的精神健康治疗和干预工具。
Nov, 2023
儿童和青少年的心理健康在过去几年中不断恶化。大型语言模型(LLMs)的出现为监测和干预的成本和时间效率提供了很大希望。我们创建了一个 Reddit 帖子的新数据集,经过专家精神科医生的标注,用于以下类别:创伤,不稳定性,病情,症状,自杀倾向和治疗,并将专家标签与两个表现最佳的 LLMs(GPT3.5 和 GPT4)的注释进行比较。我们发现 GPT4 与人际标注者一致性的表现相当,并且合成数据的性能要高得多,但我们发现模型有时仍会在否定和事实性问题上犯错误,合成数据的更高性能是由于真实数据的复杂性而不是固有优势。
Apr, 2024
大语言模型在精神卫生保健中展示了广泛的应用,涵盖诊断、患者支持等方面。然而,数据可用性、精确处理心理状态和有效评估方法等问题,导致了临床适用性和伦理考虑方面的差距存在,要推动精神卫生保健中大语言模型的进一步发展,需要依靠多学科协作、数据集开发、技术精进和伦理融合等方面的全面努力。
Jan, 2024
开发了第一个用于社交媒体上的可解释性心理健康分析的开源语言模型系列 MentalLLaMA,并通过 IMHI 数据集在正确性和解释质量方面接近最先进的判别方法。
Sep, 2023
我们提出了一个新颖的框架来评估大型语言模型(LLMs)的细致对话能力,将其应用于心理健康领域,并发现 GPT4 Turbo 在特定主题上表现出与经过验证的治疗师高度相关的成绩,从而帮助研究人员开发更好的 LLMs 以更积极地支持人们的生活。
Mar, 2024
我们在这项工作中,首次对多种大语言模型(LLMs)进行了全面评估,包括 Alpaca、Alpaca-LoRA 和 GPT-3.5,针对在线文本数据中的各种心理健康预测任务。我们进行了广泛的实验,涵盖了零样本提示、少样本提示和指令微调。研究结果表明,对于心理健康任务,LLMs 在零样本和少样本提示设计上具有有限但有希望的性能。更重要的是,我们的实验表明,指令微调可以显著提升 LLMs 在所有任务上的表现。我们最佳微调模型 Mental-Alpaca 在平衡精度上比 GPT-3.5(规模大 25 倍)高出 16.7%,并与最先进的任务特定模型相媲美。我们总结了一系列行动指南,供未来的研究人员、工程师和实践者参考,介绍如何赋予 LLMs 更好的心理健康领域知识,并成为心理健康预测任务的专家。
Jul, 2023