使用结构化纵向电子健康记录数据激励大规模语言模型进行零样本临床预测

Jan, 2024

使用结构化纵向电子健康记录数据激励大规模语言模型进行零样本临床预测

Prompting Large Language Models for Zero-Shot Clinical Prediction with Structured Longitudinal Electronic Health Record Data

HTML

PDF

Yinghao Zhu, Zixiang Wang, Junyi Gao, Yuning Tong, Jingkun An...

TL;DR针对结构化长期电子健康记录 (EHR) 数据与大型语言模型 (LLMs) 集成时的固有复杂性，本研究调查了像 GPT-4 这样的LLMs 对 EHR 数据的适应性。特别关注其零样本能力，使其能够在并未明确训练的情况下进行预测。通过考虑特定的EHR特征(如单位和参考范围)，采用与临床环境相一致的上下文学习策略，我们的寻求方法能够应对 EHR 数据的纵向、稀疏和知识注入的特性。通过对 MIMIC-IV 和 TJH 数据集进行综合实验，证明了我们精心设计的提示框架下，LLMs在关键任务(如死亡率、住院天数和30天再入院率)的预测性能可以提高约35％，在少样本情景中超越了机器学习模型。我们的研究强调了LLMs在提高临床决策能力方面的潜力，尤其是在没有标签数据的紧急医疗情况下，如新发疾病的爆发。可通过此 https URL 获得代码，以便能重现研究结果。

Abstract

The inherent complexity of structured longitudinal electronic health records (EHR) data poses a significant challenge when integrated with large language models (LLMs), which are traditionally tailored for natura