推进心理健康预筛查:一种新的定制GPT用于心理困扰评估
该研究评估了基于大型语言模型 ChatGPT 在三种文本分类任务中的表现,并发现零-shot分类准确度表明语言模型对心理健康分类任务具有潜在的应用价值。
Mar, 2023
本文详细评估了ChatGPT在11个数据集上的心理健康分析和情感推理能力,分析了不同提示策略对其分析能力和可解释性的影响,并发现情感提示可以有效提高其性能,但需要正确的情感注入方式。
Apr, 2023
评估GPT技术在诊断抑郁症方面的潜力,研究其模拟抑郁症状和抑郁量表影响能力,发现GPT可以准确模拟抑郁症状和正常个体的抑郁相关评估,但在模拟不同程度的抑郁症状方面存在误差,并且对敏感程度高的量表表现更好,具有重要的抑郁症评估潜力。
Jul, 2023
目前缺乏对大型语言模型(LLMs)在心理健康领域能力评估的全面基准。因此,我们填补该空白,并引入了首个适用于心理健康领域特点的全面基准,包括六个子任务、三个维度,系统评估LLMs在心理健康领域的能力。我们为每个子任务设计了相应的简明提示,并全面评估了八个先进的LLMs使用我们的基准。实验结果不仅展示了当前LLMs在心理健康方面的改进空间,还揭示了未来模型优化的潜在方向。
Nov, 2023
我们提出了一个新颖的框架来评估大型语言模型(LLMs)的细致对话能力,将其应用于心理健康领域,并发现GPT4 Turbo在特定主题上表现出与经过验证的治疗师高度相关的成绩,从而帮助研究人员开发更好的LLMs以更积极地支持人们的生活。
Mar, 2024
改进发展中国家中的心理健康支持是迫切的需求,其中一个潜在解决方案是开发可扩展的自动化系统进行诊断筛查,可以帮助减轻心理健康专业人员的负担。本研究评估了几种最先进的大型语言模型(LLMs),在我们的定制数据集上进行了简明摘要生成的评估。我们使用已建立的ROUGE评估指标和人工评估员的输入,对四种不同的摘要生成模型进行了严格评估。结果显示,我们表现最好的经过细化调整的模型优于现有模型,ROUGE-1和ROUGE-L分别达到0.810和0.764。此外,我们还评估了该经过细化调整的模型在公开可用的D4数据集上的泛化能力,结果令人鼓舞,表明其潜在的适用性超出了我们的定制数据集。
Mar, 2024
该研究比较了两个大型语言模型GPT-4和Chat-GPT在回应18个心理提示方面的表现,以评估它们在心理健康护理环境中的潜在适用性。结果显示GPT-4在生成临床相关和富有同理心的回应方面更有效,提供更好的支持和指导。这项研究为大型语言模型在心理健康护理领域的适用性提供了贡献,强调了在该领域持续研究和开发的重要性。需要进一步研究了解造成两个模型性能差异的具体因素,并探索其在不同人群和心理健康状况中的普适性。
May, 2024
大型语言模型的进展展示了在各个应用领域的强大能力,包括心理健康分析。然而,现有的研究着重于预测性能,对公平性这一关键问题的探讨不足,给弱势人群带来了重大风险。我们通过针对八个不同的心理健康数据集,使用十种不同的提示方法,系统地评估了七个社会因素的偏见。结果表明,GPT-4在性能和公平性方面实现了最佳的平衡,尽管在某些情况下仍落后于领域特定模型如MentalRoBERTa。此外,我们针对公平性进行调整的提示方法可以有效减轻在心理健康预测中的偏见,凸显了在该领域进行公平分析的巨大潜力。
Jun, 2024
通过使用最新的人工神经计算技术,本篇论文探索了诊断抑郁症及其相关精神障碍的方法,并提出了一种基于多模态网络的新颖解决方案,实现了更好的结果。
Jul, 2024
本文研究了大型语言模型(LLMs)在心理健康护理中的应用,评估其在人类参与者中的有效性及临床适用性。研究发现,尽管LLMs在扩展心理健康护理服务方面具有潜力,但多数研究方法不标准,并且缺乏对隐私、安全和公平性的深入探索,表明需要更严格的评估和伦理监督以确保其安全有效地整合入临床实践。
Aug, 2024