Sep, 2023

评估监督学习与大型语言模型对识别中国社交媒体中的认知扭曲和自杀风险的功效

TL;DR本研究旨在在中国社交媒体平台上评估大型语言模型对自杀风险和认知失真的识别能力,发现大型语言模型相较传统的监督学习方法存在较大的性能差距,尤其在微小类别的理解上,GPT-4 在多种情况下表现优异,而 GPT-3.5 经过微调后在自杀风险分类中显示出显著提升,表明大型语言模型在心理学领域具有前瞻性和变革性的应用潜力。