Oct, 2023

基于纵向结构化电子健康记录的氯吡格雷治疗失败的检测与预测

TL;DR我们提出机器学习算法,利用纵向结构化的电子健康记录(EHR)自动检测和预测氯吡格雷治疗的失败。通过将自然语言和结构化 EHR 进行类比,我们引入了自然语言处理(NLP)应用中使用的各种机器学习算法来构建处理失败检测和预测的模型。在此方面,我们从英国生物库中生成了一个患有氯吡格雷处方的患者队列,并注释了患者在首次氯吡格雷处方的一年内是否发生处理失败事件;在 502,527 名患者中,1,824 名患者被确定为处理失败病例,6,859 名患者被视为对照病例。从数据集中,我们将患者的诊断、处方和程序记录整合到相同日期的访问中来构建模型。模型为两个不同的任务,即检测和预测构建,实验结果显示在这两个任务中,时间序列模型优于词袋方法。特别是,一种基于 Transformer 的模型,即 BERT,在检测任务中可达到 0.928 的 AUC,而在预测任务中可达到 0.729 的 AUC。当没有足够的训练数据时,BERT 还显示出优势,因为它利用使用大量未标记数据的预训练过程。