Jan, 2024

大型语言模型在围手术期风险预测和预测中的能力

TL;DR探讨了通用领域大型语言模型(如 GPT-4 Turbo)能否通过手术过程描述和患者临床记录从电子健康记录中进行风险分层和预测术后结果指标。 对 8 个不同任务的预测性能进行了研究:ASA 身体状态分类的预测、住院、重症监护室入院、非计划入院、住院死亡、PACU 第一阶段持续时间、住院持续时间和重症监护室持续时间。 少量样本和思维链调控提高了几个任务的预测性能。 ASA 身体状态分类的 F1 分数为 0.50,重症监护室入院为 0.81,住院死亡为 0.86。 在所有提示策略中,持续时间预测任务的性能普遍较差。 当前一代大型语言模型能够协助临床医生进行围手术期风险分层的分类任务,并产生高质量的自然语言摘要和解释。