Mar, 2024

利用电子病历数据进行5年慢性病队列预测的大型多模态语言模型

TL;DR通过收集来自台湾医院数据库的五年电子健康记录,该研究提出了一个新颖的大型语言多模型(LLMMs)框架,将临床笔记和实验室检测结果的多模态数据结合起来预测慢性疾病风险,观察到将clinicalBERT和PubMed-BERT与注意力融合相结合可以在多类慢性疾病和糖尿病预测中达到73%的准确率,将实验室检测值转化为文本描述后,利用Flan T-5模型可以达到76%的ROC曲线下面积(AUROC),从而显著提高了糖尿病早期预测的准确性。